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“Erlang 是 目前 唯一 成 熟 可 靠 的 能 够 开发 高 扩展 
性 并 发 软件 系统 的 语言 ， 它 将 成 为 下 一 个 Java。” 
Ralph Johnson ， 
软件 开发 大 师 ，《 设 计 模 式 》 作 者 之 一 





“Joe 的 《Erlang 程 序 设 计 》 一 书 影 响 巨 大 。 第 2 
版 做 了 重要 更 新 ， 万 众 期 待 ， 不 但 涵盖 核心 语言 和 
框架 的 基本 内 容 ， 还 涉及 rebar 和 cowboy 这 样 的 关键 
社区 项 目 。 有 经 验 的 Erlang 程 序 员 也 能 在 书 里 找到 
各 种 有 用 的 提示 和 新 见解 ， 初 学 者 则 会 喜欢 Joe 在 介 
绍 和 阐释 关键 语言 概念 时 所 使 用 的 清楚 和 有 条 理 的 
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“一 部 佳作 。 对 函数 式 编程 的 介绍 理性 且 实 用 。” 
———Gilad Bracha ， 
Java 语 言 和 Java 虚 拟 机 规范 的 共同 作者 ， 
Newspeak 语 言 的 创造 者 ，Dart 语 言 团队 成 员 


“本 书 是 理解 如 何 进行 Actor 编 程 的 优秀 资源 ， 
不 仅 适 用 于 Erlang 开 发 人 员 ， 对 于 那些 想 要 理解 
Actor 为 何如 此 重要 ， 以 及 为 何 它们 是 构建 反应 式 、 
可 扩展 、 可 恢复 和 事件 驱动 型 系统 的 重要 工具 的 程 
序 员 ， 也 同样 适用 。 





Jonas Boner ， 
Akka 项 目 和 AspectWerkz 面 回 方 面 编 程 框架 
创立 者 ，Typesafe 联 合 创始 人 兼 CTO 


“Erlang 让 我 有 醒 酬 灌顶 之 感 ， 它 促使 我 开始 以 
完全 不 同 的 方式 思考 问题 ，Armstrong 能 够 亲自 写作 
本 书 ， 实 乃 Erlang 爱 好 者 之 福 。” 

David Thomas， 软 件 开 发 大 师 ， 
《程序 员 修 炼 之 道 》 作 者 
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内 容 提 要 
本 书 由 Erlang 之 父 Joe Armstrong 编写 ， 是 才 庸 置疑 的 经 典 著 作 。 书 中 兼顾 了 顺序 编程 、 并 发 编程 和 分 
布 式 编程 ， 深 入 讨论 了 开发 Erlang 应 用 中 至 关 重 要 的 文件 和 网 络 编程 、OTP、ETS 和 DETS 等 主题 。 新 版 
针对 入 门 级 程序 员 增 加 了 相关 内 容 。 
本 书 适合 Erlang 初学 者 和 中 级 水 平 Erlang 程序 员 学 习 人 参考 。 
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如 果 项 望 将 程序 的 行为 设计 得 与 真实 世界 物体 的 行为 相 一 致 ， 那 么 
程序 就 应 该 具有 并 发 结构 。 


使 用 专门 为 并 发 应 用 设计 的 语言 ， 开 发 将 变 得 极为 简便 。 
Erlang 程 序 模拟 了 人 类 如 何 思考 ， 如 何 交 互 。 





Joe Armstrong 


第 1 版 推荐 序 


Erlang 算 不 上 是 一 种 “大 众 流 行 ” 的 程序 设计 语言 ， 而 且 即 使 是 Erlang 的 支持 者 ， 大 多 数 也 
对 于 Erlang 成 为 “主流 语言 ”并 不 持 乐 观 态度 。 然 而 ， 目 从 2006 年 以 来 ，Erlang 语 言 确 实在 国内 
外 一 批 精英 程序 员 中 暗流 清 动 , 光 我 所 认识 和 上 听 说 的 ， 就 有 不 少 于 一 打 技术 高 手 像 着 了 魔 一 样 迷 
上 了 了 这 种 已 经 有 二 十 多 年 历史 的 老牌 语言 。 这 是 一 件 相 当 奇 怪 的 事情 。 因 为 就 年 龄 而 言 ，Erlang 
大 约 与 Perl 同 年 ， 比 C++ 年 轻 四 岁 , 长 Java 差 不 多 十 岁 , 但 Java 早 已 经 是 工业 主流 语言 ，C++ 和 Perl 
甚至 已 经 进入 其 生命 周期 的 下 降 阶 段 。 照 理 说 , 一 个 被 扔 在 角落 里 二 十 多 载 无 人 理 皮 的 老家 伙 合 
理 的 命运 就 是 坐 以 待 绝 ， 没 想到 Erlang 却 像 是 突然 吃 了 返老还童 丹 似 的 在 二 十 多 岁 的 “高 龄 ”又 
火 了 一 把 , 不 但 对 它 感 兴 趣 的 人 数量 激增 ， 而 且 还 成 立 了 一 些 组 织 ,， 开 发 实施 了 一 些 非 常 有 影 啊 
力 的 软件 项 目 。 这 是 怎么 回 事 呢 ? 

根本 原因 在 于 Erlang 天 赋 异 课 恰 好 适应 了 计算 环境 变 旱 的 大 趋势 CPU 的 多 核 化 与 云 计算 。 

自 2005 年 C++ 标准 委员 会 主席 Herb Sutter 在 Dr Dobb’s Journal 上 发 表 《 人 免费 午餐 已 经 结束 》 
一 门 以 来 , 人 们 已 经 确凿 无 疑 地 认识 到 , 如果 未 来 不 能 有 效 地 以 并 行 化 的 软件 充分 利用 并 行 化 的 
便 件 资源 , 我们 的 计算 效率 就 会 永远 集 沛 在 仪 仪 略 高 于 当前 的 水 平 上 ， 而 不 得 动弹 。 因 此 ,未 来 
的 计算 必然 是 并 行 的 。Herb Sutter 本 人 曾 表示 ， 如 果 一 门 语 言 不 能 够 以 优雅 可 靠 的 方式 处 理 并 行 
计算 的 问题 ， 那 它 就 失去 了 在 21 世 纪 的 生存 权 。 “主流 语言 ”当然 不 想 真 的 丧失 抒 这 个 生存 权 ， 
于 是 纷纷 以 不 同 的 方式 解决 并 行 计 算 的 问题 。 就 CC++ 而 言 ， 除 了 标准 委员 会 致力 于 以 标准 库 的 
方式 来 提供 并 行 计 算 库 之 外 , 标准 化 的 OpenMP 和 MPI, 以 及 Intel 的 Threading Building Blocks 库 也 
都 是 可 信赖 的 解决 方案 ; Java 在 $.0 版 中 引入 了 意义 重大 的 concurrency 库 ， 得 到 Java 社 区 的 一 致 推 
及 ; 而 微软 更 是 采用 了 多 种 手段 来 应 对 这 一 问题 : 先是 在 NET 中 引入 APM， 随 后 又 在 Robotics 
Studio 中 提供 了 CCR 库 ， 最 近 又 发 布 了 Parrallel FX 和 MPINET， 可 谓 不 遗 余力 。 然 而 ， 这 些 手法 
都 可 以 视 为 亡 手 补 牢 , 因为 这 些 语 言 和 基础 设施 在 创造 时 都 没有 把 并 行 化 的 问题 放 到 优先 的 位 置 
来 考虑 。 与 它们 相反 ，Erlang 从 其 构思 的 时 候 起 ， 就 把 “并 行 ” 放 到 了 中 心 位 置 ， 其 语言 机 制 和 
细 广 的 设计 无 不 从 并 行 角 度 出 发 和 考虑 , 并 且 在 长 达 二 十 年 的 发 展 完善 中 不 断 成 熟 。 今 天 , Erlang 
可 以 说 是 为 数 不 多 的 天 然 适 应 多 核 的 可 靠 计 算 环 境 ， 这 不 能 不 说 是 一 种 历史 的 机 缘 。 

另 一 个 可 能 更 加 迫切 的 变革 ， 就 是 云 计算 。Google 的 实践 表明 ， 用 廉价 服务 器 组 成 的 服务 器 
集群 , 在 计算 能 力 、 可 靠 性 等 方面 能 够 达到 价格 昂 贯 的 大 型 计算 机 的 水 准 , 上 毫 无 疑问 , 这 是 大 型 、 
超大 型 网 站 和 网 络 应 用 梦 央 以 求 的 境界 。 然 而 ， 要 到 达 这 个 境界 并 不 容易 。 目 前 一 般 的 网 站 为 了 
达成 较 好 的 可 延展 性 和 运行 效率 , 需要 聘请 有 经 验 的 架构 师 和 系统 管理 人 员 , 手工 配置 网 络 服务 
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端 架 构 ， 并 有 旦 常备 一 个 高 水 准 的 系统 运 维 部 门 ， 随 时 准备 处 理 各 种 意外 情况 。 可 以 说 , 虽然 大 多 
数 Web 企 业 只 不 过 是 想 在 这 些 基 础 设施 上 运行 应 用 而 已 ， 但 仅仅 为 了 让 基础 设施 正常 运转 ， 企 业 
就 必须 投入 巨大 的 资源 和 精力 。 现 在 甚至 可 以 说 , 这 方面 的 能 力 成 了 大 型 和 超大 型 网 站 的 核心 竞 
争 力 。 这 与 操作 系统 成 熟 之 前 人 们 自己 动手 设置 硬件 并 且 编 写 驱 动 程序 的 情形 类 似 一 一 做 应 用 的 
人 要 精通 底层 细 方 。 这 种 格局 的 不 合理 性 一 望 便 知 , 而 解决 的 思路 也 是 一 目 了 然 一 一 建立 网 络 服 
务 端 计算 的 操作 系统 , 也 就 是 类 似 Google 已 经 建立 起 来 的 “ 云 计 算 ” 那样 的 平台 。 所 谓 “ 云 计算 ”， 
指 的 是 结果 ， 而 当前 的 关键 不 是 这 个 结果 ， 而 是 作为 手段 的 “计算 云 "。 计 算 云 实际 上 就 是 控制 
大 型 网 络 服务 需 集 群 计算 资源 的 操作 系统 , 它 不 但 可 以 自动 将 计算 任务 并 行 化 , 充分 调动 大 型 服 
务 顺 集群 的 计算 能 力 ， 而 且 还 可 以 自动 应 对 大 多 数 系统 故障 ， 实 现 高 水 平 的 自主 管理 。 计 算 云 技 
术 是 网 络 计算 时 代 的 操作 系统 ,是 绝对 的 核心 技术 , 也 正 因 此 ,很 多 赫赫 有 名 的 中 外 大 型 IT 企业 
都 在 不 惜 投 入 巨 资 研发 计算 云 。 包括 我 在 内 的 很 多 人 都 相信 ， 云 计算 将 不 仅 从 根本 上 改变 我 们 的 
计算 环境 ,而 且 将 从 根本 上 改变 IT 产 业 的 盘 利 模式 ,是 真正 几 十 年 一 遇 的 重大 变 章 ， 对 于 一 些 企 
业 和 技术 人 员 来 说 是 重大 的 历史 机 遇 。 恰 恰 在 这 个 主题 上 ，Erlang 又 具有 先天 的 优势 ， 这 当然 也 
是 归结 于 其 与 生 俱 来 的 并 行 计算 能 力 ， 使 得 开发 计算 云 系 统 对 于 Erlang 来 说 格外 轻松 容易 。 现 在 
Erlang 社 区 已 经 开发 了 一 些 在 实践 中 被 证 明 非 常 有 效 的 云 计 算 系 统 ， 学 习 Erang 和 这 些 系统 是 迅 
速 进入 这 个 领域 并 且 提 高 水 平 的 捷径 。 

由 此 可 见 , Erlang 虽 然 目 前 还 不 是 主流 语言 , 但 是 有 可 能 会 在 未 来 一 段 时 间 发 挥 重要 的 作用 ， 
此 ， 对 于 那些 愿意 领略 技术 前 沿 风 景 的 “先锋 派 ” 程 序 员 来 说 ， 了 解 和 学 习 Erlang 可 能 是 非常 
有 价值 的 投资 。 即 使 你 未 来 不 打算 使 用 Erlang, 也 非常 有 可 能 从 Erlang 的 设计 和 Erlang 社 区 的 智 匡 
中 得 到 启发 ， 从 而 能 够 在 其 他 语言 的 项 目 中 更 好 地 完成 并 行 计算 和 云 计算 相关 的 设计 和 实现 任 
务 。 再 退 一 步 说 ， 就 算 只 是 从 开启 思路 、 全 面 认 识 计算 本 质 和 并 行 计算 特性 的 角度 出 发 ，Erlang 
也 值得 了 解 。 所 以 ， 我 很 希望 这 本 书 在 中 国 程序 员 社区 中 不 要 遭 到 冷遇 。 

本 书 是 由 Erlang 创 造 者 Joe Armstrong 杀 自 执 笔 扎 写 的 Erlang 语 言 权 威 参考 书 ， 原 作 以 轻松 引 
导 的 方式 帮助 谈 者 在 实践 中 理解 Erlang 的 深刻 设计 思路 ， 并 和 擎 握 以 Erlang 开 发 并 行程 序 的 技术 ， 
在 技术 图 书 中 属于 难得 的 佳作 。 两 位 译 者 我 都 认识 ,他 们 都 是 技术 精湛 而 思想 深刻 的 “先锋 派 ”， 
对 Erlang 有 着 极 高 的 热情 ， 因 此 翻译 质量 相当 高 ， 阅 读 起 来 流畅 通顺 ， 为 此 书 中 译本 添 色 不 少 。 
有 兴趣 的 读者 集中 一 段 时 间 按 图 索 葛 ， 完 全 有 可 能 就 此 踏 上 理解 Erlang、 应 用 Erlang 的 大 路 。 



















































































孟 岩 
IBM 中 国 公司 媒体 关系 主管 
前 CSDN 首 席 分 析 师 兼 《程序 员 》 杂 志 技术 主编 
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越 来 越 多 的 新 硬件 是 并 行 的 ， 所 以 新 的 编程 语言 必须 支持 并 发 性 ， 否 则 它们 将 会 灭亡 。 


“处 理 器 行业 的 发 展 方向 是 不 断 添 加 更 多 的 核心 ， 但 是 没 人 知道 如 何 给 它们 编程 。 
我 的 意思 是 : 双核 ? 可 以 。 四 核 ? 很 难 。 八 核 ” 算 了 吧 ，” 
一 一 史 蒂 夫 .乔布斯 


乔布斯 说 得 不 对 , 我 们 其 实 知 道 如 何 给 多 核 编程 。 我们 在 Erlang 里 就 这 么 做 , 而 有 旦 核心 越 多 ， 
许多 程序 就 跑 得 越 快 。 

Erlang 从 一 开始 台 被 设计 用 于 目下 而 上 地 编写 并 发 式 、 分 布 式 、 容 错 、 可 扩展 和 软 实时 ( soft 
real-time ) 系统 的 程序 。 软 实时 系统 是 指 电话 交换 机 和 银行 业务 系统 这 样 的 系统 ， 对 它们 而 言 ， 
快速 的 啊 应 时 间 很 重要 , 但 偶尔 错过 了 时 限 也 不 是 什么 灾难 性 的 。Erlang 系 统 已 经 被 大 规模 部 署 ， 
并 且 探 制 了 全 世界 许多 重要 的 移动 通信 网络。 

如 果 你 的 问题 是 并 发 的 ,或 者 正在 组 建 多 用 户 的 系统 ,或 者 你 组 建 的 系统 需要 随时 间 而 改变 ， 
那么 使 用 Erlang 也 许 会 为 你 节省 大 量 的 工作 ， 因 为 Erlang 就 是 特别 为 组 建 这 些 系 统 而 设计 的 。 


“问题 在 于 可 变 状 态 , 傻瓜 。” 














一 一 摘自 Brian Goetz 所 著 《Java 并 发 编程 实战 》 


Erlang 是 函数 式 编程 语言 。 困 数 式 编程 禁止 代码 存在 副作用 。 副 作用 和 并 发 性 不 能 共存 。 在 
Erlang 里 ， 改 变 单个 进程 内 部 的 状态 是 允许 的 ， 但 一 个 进程 改动 另 一 个 的 状态 则 不 行 。Erlang 里 
没有 互 斥 ， 没 有 同步 方法 ， 也 没有 内 存 共 享 式 编程 的 各 种 设备 。 

各 个 进程 能 且 只 能 用 一 种 方法 进行 交互 ， 那 就 是 交换 消息 。 进 程 之 间 不 共享 任何 数据 。 这 就 
是 我 们 可 以 把 Erlang 程 序 轻松 部 署 到 多 核 或 网 络 的 原因 。 

编写 Erlang 程 序 时 ， 实 现 的 方式 不 是 让 单个 进程 执行 所 有 任务 ， 而 是 生成 大 量 只 做 简单 事情 
的 小 进程 ， 并 让 它们 互相 通信 。 


本 书 主要 内 容 
本 书 介绍 并 发 性 、 分 布 、 容 错 和 函数 式 编程 阐述 如 何 编写 一 个 没有 锁 与 互 斥 、 只 是 纯粹 使 





























GD http://bits.blogs.nytimes.com/2008/06/10/apple-in-parallel-turning-the-pc-world-upside-down/ 


用 消息 传递 的 分 布 式 并 发 系统 ,如 何在 多 核 CPU 上 自动 加 速 程序 ,如 何 编写 让 人 们 互相 交流 的 分 
布 式 应 用 程序 。 还 介绍 了 如 何 编写 容错 和 分 布 式 系统 的 设计 模式 ， 如 何 给 并 发 性 建 醒 、 再 把 这 些 
模型 映射 到 计算 机 程序 上 《我 把 这 一 过 程 称 为 面向 并 发 性 的 程序 设计 )。 


目标 读者 


本 书 的 目标 读者 上 至 经 验 丰 宦 但 想 有 要 了 解 更 多 Erlang 内 部 细 市 和 背后 哲学 的 Erlang 程 序 员 ， 
至 不 折 不 扣 的 初学 者 。 书 中 的 内 容 已 经 被 从 专家 到 初学 者 的 各 级 程序 员 审 读 过 。 第 2 版 与 第 1 
版 的 一 个 主要 区 别 是 , 第 2 版 添加 了 大 量 针对 初学 者 的 解释 性 材料 。 高 级 Erlang 程 序 员 可 以 跳 过 这 
些 介绍 材料 。 

本 书 还 想 阐 明 陶 数 式 编程 、 并 发 编程 与 分 布 式 编程 ,并 将 它们 以 合适 的 方式 呈现 给 之 前 不 了 
解 并 发 或 函数 式 编 程 的 读者 。 编 写 函 数 式 程序 和 并 行程 序 长 久 以 来 者 被 当成 是 一 种 “水 术 ”, 硕 
望 本 书 能 让 人 们 对 此 有 新 的 认识 。 

虽然 本 书 不 假定 读者 拥有 特定 的 吧 数 式 或 并 发 编程 知识 ,但 是 需要 读者 熟悉 一 两 种 编程 语言 。 

当 你 接触 一 门 新 的 编程 语言 时 ， 往 往 难 以 想到 “适合 用 新 语言 解决 的 问题 "。 书 中 的 练习 会 
给 你 一 些 提 示 。 这 些 问 题 很 适合 在 Erlang 里 解决 。 


新 版 说 明 


首先 ,， 书 中 的 内 容 已 经 做 了 更 新 ,以 反映 出 目 第 1 版 面世 以 来 Erlang 历 经 的 所 有 变化 。 现 在 我 
们 已 经 涵盖 了 所 有 的 官方 语言 改动 ， 并 介绍 Erlang 的 R17 版 。 

第 2 版 把 焦点 转移 到 了 满足 初学 者 的 需求 上 , 相 比 第 1 版 有 了 更 多 的 解释 性 文字 。 那 些 针 对 高 
级 用 户 或 可 能 迅速 变化 的 材料 已 经 被 转移 到 了 在 线 资源 区 。 

事实 证 明 ， 第 1 版 里 的 编程 练习 非常 受 读者 欢迎 ， 因 此 现在 每 一 章 的 最 后 都 附 上 了 练习 。 这 
些 练习 复杂 程度 各 异 ， 所 以 初学 者 和 高 级 用 户 总 能 找到 适合 自己 的 。 

在 新 增 的 一 些 章节 中 ， 你 将 学 到 Erlang 的 类 型 系统 和 Dialyzer 、 上 映射 组 〈 在 Erlang 的 R17 版 里 
新 增 )、WebSocket 、 编 程 习惯 用 语 及 如 何 集 成 第 三 方 代 码 。 还 新 增 了 一 篇 附录 ,介绍 如 何 组 建 一 
个 独立 的 最 小 化 Erlang 系 统 。 

本 书 的 最 后 一 曹 “ 福 尔 摩 斯 的 最 后 一 和 案 ” 是 全 新 的 ， 里 面 提 供 了 一 项 练习 : 处 理 大 批量 的 文 
本 并 从 中 提取 音义。 这 一 章 是 开放 式 的 ,希望 它 后 面 的 练习 能 激发 更 进一步 的 工作 。 
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要 学 会 跑 ， 必 须 先 学 会 走路 。Erlang 程 序 是 由 许多 同时 运行 的 小 型 顺序 程序 组 成 的 。 在 编写 
并 发 代码 之 前 ,我 们 需要 能 够 编写 顺序 代码 。 这 就 意味 着 在 第 11 章 之 前 , 我 们 不 会 深入 到 编写 并 
发 程序 的 细节 当中 。 

D 第 一 部 分 简单 介绍 了 并 发 编程 的 核心 概念 ， 并 带 你 快速 游历 Erlang。 

















口 第 二 部 分 详细 介绍 了 Erlang 的 顺序 编程 ,还 讨论 了 构建 Erlang 应 用 程序 所 需 的 类 型 和 方法 。 
口 第 三 部 分 是 本 书 的 核心 ， 我 们 将 学 习 如 何 编写 并 发 和 分 布 式 的 Erlang 程 序 。 
口 第 四 部 分 讨论 了 主要 的 Erlang 库 、 跟 踪 和 调试 的 技巧 ， 以 及 组 织 Erlang 代 码 的 技巧 。 
口 第 五 部 分 涉及 应 用 程序 。 你 会 学 到 如 何 将 外 部 软件 与 Erlang 的 核心 库 集 成 ， 以 及 如 何 转换 
你 目 己 的 代码 来 把 它 奉 献 给 开源 事业 。 我 们 将 讨论 编程 习惯 用 语 和 如 何 为 多 核 CPU 编程 。 
最 后 ,“ 夏 洛克 ' 福尔摩斯 ”会 分 析 我 们 的 思路 。 
在 每 一 半 的 最 后 , 你 都 会 看 到 一 组 精心 挑选 的 编程 练习 。 它们 的 目的 是 测试 你 对 本 章 知 识 的 
掌握 情况 ,同时 癌 你 发 起 挑战 。 这 些 问 题 难 度 各 异 , 最 大 的 难题 是 合适 的 研究 项 目 。 即 使 你 并 不 
打算 尝试 解决 所 有 问题 ,单单 思考 问题 本 号 以 及 如 何 解 决 问题 也 会 增强 你 对 书 中 内 容 的 理解 。 


本 书 里 的 代码 


大 多 数 代码 片段 都 来 源 于 可 下 载 的 完整 运行 范例 "。 为 了 方便 读者 查询 ， 如 果 书 中 的 某 个 代 
人 码 清单 可 供 下 载 ， 代 码 片 段 上 方 就 会 有 一 个 提示 条 《就 像 此 处 所 显示 的 小 





























shop1.erl 
-module(shopl). 
-export([total/1]). 


total([{what, N}|T]) -> shop:cost(What) * N + total(T); 
total([]) -> 0. 

这 个 提示 条 内 含 代码 在 下 载 区 里 的 路 径 。 如 果 你 正在 阅读 本 书 的 电子 版 , 并 且 你 的 电子 书 阅 
读 禹 文 持 超 链 接 ， 就 可 以 点 击 提示 条 ， 代 码 应 该 会 出 现在 浏览 硕 窗 口中 。 


帮 帮 有 我 ! 出 问题 了 


学 习 新 东西 并 不 容易 ， 你 会 遇 到 棘手 的 难题 。 当 你 遇 到 难题 时 ， 原 则 一 是 不 要 轻易 放弃 。 原 
则 二 是 寻求 帮助 。 原 则 三 是 询问 “福尔摩斯 ”。 

原则 一 很 重要 。 有 些 人 尝试 了 Erlang， 迪 到 难题 后 选择 了 放弃 ， 没有 告诉 任何 人 。 如 果 我 们 
不 知道 某 个 问题 存在 ,我们 就 无 法 修复 它 。 

寻求 帮助 的 最 佳 方式 是 首先 用 谷歌 找 找 看 , 如 果 谷 歌 帮 不 上 忙 , 你 可 以 给 Erlang 的 邮件 列表 “发 
送 邮 件 。 如 果 想 要 更 快速 的 响应 ， 还 可 以 试 试 irc.freenode.net 上 的 #erlounge 或 #erlang。 

有 时 候 ， 问 题 的 答案 也 许 在 Erlang 邮 件 列表 的 某 篇 旧 帖 子 上 ， 但 你 就 是 找 不 到 。 在 第 27 草 有 
一 个 可 以 本 地 运行 的 程序 ， 它 能 对 Erlang 邮 件 列表 里 的 所 有 旧 帖 子 执行 复杂 的 搜索 。 

言 归 正 传 ， 下 面 感谢 那些 帮助 我 编写 本 书 〈 以 及 本 书 第 1 版 ) 的 人 们 。 你 可 以 跳 过 去 这 一 内 
容 直 奔 第 1 草 ， 在 那里 我 将 带 你 快速 游历 Erlang。 
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第 一 部 分 
为 何 用 Erlang 





本 部 分 将 介绍 什么 是 并 发 ， 然 后 讨论 并 发 和 并 
行 的 区 别 。 你 将 会 了 解 到 编写 并 发 程序 的 益处 ， 并 
快速 游历 Erlang， 其 中 介绍 了 这 种 语言 的 主要 特性 。 











让 我 们 暂时 忘却 计算 机 ， 我 将 放眼 和 窗外， 告诉 你 我 所 看 见 的 。 

我 看 见 一 个 女人 正在 亡 狗 , 一 辆 车 正 试图 寻找 一 个 停车 位 ,飞机 在 头顶 上 发 过, 船只 在 附近 
航行 。 所 有 这 些 事 都 是 并 行 发 生 的 。 在 本 书 中 ,我 们 将 会 学 习 如 何 将 并 行 活动 描 述 为 相互 通信 的 
多 组 并 行进 程 ， 并 学 习 如 何 编写 并 发 程序 。 

在 日 常用 语 中 ， 并 发 (concurrent )、 同 时 (simultaneous ) 和 并 行 (parallel ) 等 词 几乎 表示 同 

个 意思 。 但 在 编程 语言 里 需要 做 更 精确 的 区 分 。 具 体 而 言 ， 我 们 需要 区 分 并 发 和 并 行程 序 。 

如 采 只 有 一 台 单 核 的 计算 机 ， 是 无 法 在 上 面 运行 并 行程 序 的 。 因 为 只 有 一 个 CPU， 而 它 一 次 
只 能 做 一 件 事 。 人 然而， 可 以 在 单 核 计算 机 上 运行 并 发 程序 。 计 算 机 在 不 同 的 任务 之 间 分 至 时 间 ， 
使 人 产生 这 些 任 务 是 并 行 运 行 的 错觉 。 

在 接 下 来 的 几 市 中 , 我 们 会 从 一 些 人 简单 的 并 发 模型 起 步 , 然后 看 看 用 并 发 解决 问题 有 哪些 益 
处 ， 最 后 展示 一 些 突出 并 发 与 并 行 区 别 的 精确 定义 。 


1.1 给 并 发 建 模 


我 们 将 从 一 个 简单 的 例子 入 手 ,为 一 种 日 党 情景 构建 并 发 模型 ,设想 我 看 见 四 个 人 出 去 散步 ， 
另外 还 有 两 条 狗 和 一 大 群 免 子 。 这 些 人 正在 相互 交谈 ， 而 狗 则 想 要 追逐 兔子 。 

要 在 Erlang 里 模拟 这 些 ， 需 要 编写 四 个 模块 ， 名 字 分 别 是 person (人 )、dog ( 狗 )、rabbit 
(合子 ) 和 worLd (世界 )，person 的 代码 会 放 在 名 为 person.erl 的 文件 里 ， 看 起 来 就 像 是 这 样 : 


-module (person), 
-export([init/1]). 









































init(Name) -> ,，,， 

第 1] 行 -modute(person) .的 意思 是 此 文件 包含 用 于 person 模 块 的 代码 。 它 应 该 与 文件 名 一 
致 (除了 .erl 这 个 文件 扩展 名 )。 模块 名 必须 以 一 个 小 写字 母 开头 。 从 技术 上 说 ,模块 名 是 一 个 
原子 ( atom )( 关于 原子 的 详细 介绍 ， 可 参见 3.5 市 )。 

模块 声明 之 后 是 一 条 导出 声明 。 导 出 声明 指明 了 模块 里 哪些 函数 可 以 从 模块 外 部 进行 调用 。 
它们 类 似 于 许多 编程 语言 里 的 public 声 明 。 没 有 包括 在 导出 声明 里 的 函数 是 私有 的 ， 无 法 在 模 
块 外 调用 。 
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-export([init/1]) .语法 的 意思 是 市 有 一 个 参数 (7/1 指 的 就 是 这 个 意思 ， 而 不 是 除 以 1 ) 
的 也 数 ijnit 可 以 在 模块 外 调用 。 如 有 果 想 要 导出 多 个 也 数 ， 就 应 该 使 用 下 面 这 种 语法 : 

-export([FuncNamel/N1l, FuncName2/N2, ..... ] ) ， 

方 括号 [ ...] 的 意思 是 “列表 "， 因 此 这 条 声明 的 意思 是 我 们 想 要 从 模块 里 导出 一 个 函数 


列表 。 
我 们 也 会 给 dog 和 rabbit 编 写 类 似 的 代码 。 


1.1.1 开始 模拟 


要 局 动 程序 ， 可 以 调用 world:start()。 它 定义 在 一 个 名 为 world 的 模块 里 ， 这 个 模块 的 开 
头 部 分 就 像 这 样 : 

-module (world)., 

-export([start/0]). 

















start() -> 
Joe = spawn (person, init, {"Joe"]), 
Susannah = spawn (person, init, {"Susannanh"1), 
Dave = Spawn (person, init, ['"Dave"]), 
Andy = Spawn (person, init, {"Andy"}]), 
Rover = Spawn (dog, init, ["Rover"]), 


Rabbit1 = spawn(rabbit, init, Tf"Fliopsy"]), 


spawn 是 一 个 Erlang 基 本 函数， 它 会 创建 一 个 并 发 进程 并 返回 一 个 进程 标识 符 。spawn 可 以 
这 样 调 用 : 
spawn (ModName, FuncName, [Argl, Arg2, ..., ArgN]) 


当 Erlang 运 行 时 系统 执行 spawn 时 ， 它 会 创建 一 个 新 进程 〈 不 是 操作 系统 的 进程 ， 而 是 一 个 
由 Erlang 系 统管 理 的 轻 量 级 进程 )。 当 进程 创建 完毕 后 , 它 便 开始 执行 参数 所 指定 的 代码 -ModName 
是 包含 想 要 执行 代码 的 模块 名 。FuncName 是 模块 里 的 消 数 名 ， 而 [Argl1，Arg2，...] 是 一 个 列 
表 , 包含 了 想 要 执行 的 邹 数 参数 。 因 此 ,下面 这 个 调用 的 意思 是 启动 一 个 执行 函数 person:init 
("Joe") 的 进程 . 














spawn (person, init, ["Joe"]) 


spawn 的 返回 值 是 一 个 进程 标识 符 ( PID，Process IDentifier )， 可 以 用 来 与 新 创建 的 进程 交互 。 


与 对 象 类 比 
Erlang 里 的 模块 类 似 于 面向 对 多 编程 语言 (OOPL, Object-Oriented Programming Language ) 
里 的 类 ， 进 程 则 类 似 于 OOPL 里 的 对 象 (或 者 说 类 实例 )。 
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在 Erlang 里 ，Sspawn 通 过 运行 某 个 模块 里 定义 的 函数 创建 一 个 新 进程 。 而 在 Java 里 ，new 通 
过 运行 某 个 类 中 定义 的 方法 创建 一 个 新 对 象 。 

在 OOPL 里 可 以 用 一 个 类 创建 数 千 个 类 实例 。 类 似 地 ， 在 Erlang 里 我 们 可 以 用 一 个 模块 创 
建 数 千 甚至 数 百 万 个 执行 模块 代码 的 进程 。 所 有 Erlang 进 程 都 并 发 且 独 立 执行 ， 如 果 有 一 台 百 
万 核 的 计算 机 ， 黄 至 可 以 并 行 运 行 。 


1.1.2 ”发送 消息 

局 动 模拟 之 后 ,我们 希望 在 程序 的 不 同 进 程 之 间 发 送 消 上 息 。 在 Erlang 里 ,各 个 进程 不 共 至 内 
存 ， 只 能 通过 发 送 消 息 来 与 其 他 进程 交互 。 这 就 是 现实 世界 里 的 物体 行为 。 

假设 Joe 想 要 对 Susannah 说 些 什 么 。 在 程序 里 我 们 会 编写 这 样 一 行 代码 : 








Susannah ! {self(), "Hope the dogs don't chase the rabbits"} 

Pid ! Msg 语 法 的 意思 是 发 送 消息 Msg 到 进程 Pid。 大 括号 里 的 self() 参 数 标 明了 发 送 消息 
的 进程 〈 在 此 处 是 Joe )。 
1.1.3 ”接收 消息 

为 了 让 Susannah 的 进程 接收 来 日 Joe 的 消息 ， 要 这 样 号 : 


receive 
{From, Message} -> 











end 

当 Susannah 的 进程 接收 到 一 条 消息 时 ， 变 量 From 会 绑 定 为 Joe， 这 样 Susannah 就 知道 消息 来 
自 何 处 ， 变 量 Message 则 会 包含 此 消息 。 

可 以 设想 扩展 一 下 这 个 模型 ， 让 狗 相 互 发 送 “汪汪 ! 兔子 ”的 消息 ， 而 兔子 则 相互 发 送 “ 危 
险 ! 快 舱 起 来 ”的 消息 。 

这 里 应 该 记 住 的 关键 一 点 是 : 编程 模型 基于 对 现实 世界 的 观察 。 之 所 以 有 三 个 模块 ( person、 
dog 和 rabbit ) 是 因为 例子 里 有 三 种 并 发 的 事物 。world 柑 块 的 作用 是 让 一 个 顶级 进程 来 启动 这 
一 切 。 创建 两 个 狗 进 程 是 因为 有 两 条 狗 , 创建 四 个 人 进程 是 因为 有 四 个 人 。 程序 里 的 消息 则 反映 
出 我 们 在 例子 中 观察 到 的 消息 。 

我 们 不 会 扩展 这 个 模型 ， 而 是 就 此 止步 ， 换 个 话题 ， 来 看 看 并 发 程序 的 一 些 特 性 。 


1.2 并 发 的 蔡 处 


并 发 编程 可 以 用 来 提升 性 能 , 创建 可 扩展 和 容错 的 系统 , 以 及 编写 清晰 和 可 理解 的 程序 来 控 
制 现实 世界 里 的 应 用 。 下 面 给 出 了 一 些 理由 。 
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@ 性 能 和 

设想 有 两 个 任务 : A 需要 10 秒 的 执行 时 间 ，B 需 要 15 秒 。 在 单个 CPU 上 执行 A 和 B 需 要 25 
秒 。 而 在 拥有 两 个 可 独立 运行 CPU 的 计算 机 上 ， 执 行 A 和 B 只 需要 花费 1$ 秒 。 要 实现 这 样 
的 性 能 提升 ， 必 须 编写 并 发 程序 。 
并 行 计算 机 一 直 以 来 都 是 少见 而 且 昂 贯 的 ， 但 如 今 多 核 计算 机 已 经 普及 开 来 了 。 顶 级 的 
处 理 需 拥有 64 核 ， 每 个 芯片 的 核 的 数量 也 有 望 会 在 短期 内 稳步 增加 。 如 果 有 合适 的 问题 
和 一 人 台 64 核 的 计算 机 ， 你 的 程序 在 它 上 面 就 可 能 会 变 快 64 倍 ， 但 是 只 有 编写 并 发 程序 才 
能 做 到 这 一 点 。 
计算 机 行业 最 为 紧迫 的 问题 在 于 难以 让 传统 的 顺序 代码 在 多 核 计 算 机 上 并 行 执 行 。Erlang 
不 存在 这 个 问题 。20 年 前 为 顺序 机 器 编写 的 Erlang 程 序 拿 到 当今 的 多 核 计 算 机 上 立刻 就 能 
变 得 更 快 。 

@ 可 扩展 性 
并 发 程序 由 多 个 小 型 的 独立 进程 组 成 。 因 此 ， 增 加 进程 数量 和 添加 更 多 的 CPU 便 可 轻松 
扩展 系统 。 在 运行 时 ，Erlang 虚 拟 机 会 自动 在 可 用 的 CPU 之 间 分 配 进程 的 执行 。 

@ 容错 ' 性 
容错 性 和 可 扩展 性 类 似 。 容 错 的 关键 是 独立 性 和 人 硬件 见 余 。Erlang 程 序 由 许多 小 型 的 独立 
进程 组 成 。 一 个 进程 里 的 错误 不 会 导致 男 一 个 进程 意外 骨 沉 。 为 了 防范 整 台 计算 机 (或 
数据 中 心 ) 发 生 故 障 ， 需 要 进行 远程 计算 机 的 故障 探测 。 独 立 进程 和 远程 故障 探测 都 内 
建 在 Erlang 的 虚拟 机 中 。 
Erlang 被 设计 用 于 构建 容错 式 电信 系统 ,但 同样 的 技术 也 适用 于 构建 容错 式 可 扩展 的 Web 
系统 和 云 服 务 。 

@ 清晰 性 
在 现实 世界 里 ， 万 事 是 并 行 发 生 的 ， 但 在 大 多 数 编程 语言 里 事情 是 顺序 发 生 的 。 现 实 世界 并 
行 性 和 编程 语言 顺序 性 之 间 的 不 匹配 使 得 用 顺序 性 语言 编写 控制 现实 问题 的 程序 变 得 困难 。 
在 Erlang 里 可 以 直观 地 将 现实 世界 的 并 行 性 映射 到 Erlang 的 并 发 性 上 。 这 就 使 代码 变 得 清 
晰 和 易于 理解 。 
了 解 这 些 益 处 之 后 ， 我 们 接 下 来 会 试 着 更 准确 地 解释 并 发 和 并 行 这 两 个 概念 ， 为 在 后 面 
的 章节 里 讨论 这 些 术语 打下 基础 。 


1.3 ”并 发 程序 和 并 行 计算 机 
现在 我 要 卖弄 一 下 学 者 风范 ,尝试 给 出 并 发 和 并 行 这 类 术语 的 准确 含义 。 先 来 区 分 一 下 并 发 
程序 ( 也 就 是 如 果 有 并 行 计算 机 就 可 能 会 跑 得 更 快 的 程序 ) 和 多 核 (或 CPU ) 的 并 行 计算 机 。 


口 并 发 程序 是 一 种 用 并 发 编程 语言 编写 的 程序 。 编 写 并 发 程序 是 为 了 提升 性 能 、 可 扩展 性 
和 容错 性 。 
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口 并 发 编程 语言 拥有 专门 用 于 编写 并 发 程序 的 语言 结构 。 这 些 结 构 是 编程 语言 的 主要 部 分 ， 
在 所 有 操作 系统 上 都 有 着 相同 的 表现 。 

口 并 行 计算 机 是 一 种 有 多 个 处 理 单 元 (CPU 或 核心 ) 同时 运行 的 计算 机 。 

Erlang 里 的 并 发 程序 是 由 互相 通信 的 多 组 顺序 进程 组 成 的 。 一 个 Erlang 进 程 就 是 一 个 小 小 的 
虚拟 机 ， 可 以 执行 单个 Erlang 困 数 。 别 把 它 和 操作 系统 的 进程 相 混 消 。 

要 用 Erlang 编 写 一 个 并 发 程序 ， 必 须 确 定 一 组 用 来 解决 问题 的 进程 。 这 种 确定 进程 的 做 法 被 
称 为 并 发 建 模 。 它 类 似 于 在 编写 面向 对 象 程 序 时 确定 所 需 对 象 的 技艺 。 

在 面向 对 象 设 计 里 , 选 出 解决 问题 所 需 的 对 象 是 一 个 公认 的 难题 。 并 发 建 模 也 是 如 此 。 选 出 
正确 的 进程 可 能 会 很 困难 。 好 的 进程 模型 能 实现 设计 ， 差 的 模型 则 会 毁 了 设计 。 

编写 完 并 发 程序 之 后 , 可 以 在 并 行 计 算 机 上 运行 。 我 们 可 以 在 单 台 多 核 计算 机 上 运行 ,还 可 
以 在 一 组 联网 的 计算 机 上 运行 ， 也 可 以 在 云端 运行 。 

我 们 的 并 发 程序 是 否 真 的 会 在 并 行 计 算 机 上 并 行 运行 ? 有 时 候 你 很 难 知道 。 在 多 核 计算 机 
上 ,操作 系统 也 许 会 决定 关闭 一 个 核心 来 节能 。 在 云端 ， 某 个 计算 也 许 会 被 挂 起 并 转移 到 一 台新 
机 需 上 。 这 些 情 况 不 在 我 们 的 控制 范围 内 。 

现在 我 们 了 解 了 并 发 程序 和 并 行 计算 机 之 间 的 区 别 。 并 发 性 与 软件 结构 有 关 , 而 并 行 性 与 人 硬 
件 有 关 。 下 面 来 看 看 顺序 和 并 发 编程 语言 之 间 的 区 别 。 


1.4 顺序 和 并 发 编程 语言 


编程 语言 有 两 种 : 顺序 和 并 发 。 顺序 语言 被 设 计 用 于 编写 顺序 程序 , 没有 描述 并 发 计算 的 语 
言 结构 。 并 发 编程 语言 被 设计 用 于 编写 并 发 程序 ， 语 言 本 里 种 有 表达 并 发 性 的 特殊 结构 。 

在 Erlang 里 ， 并 发 性 由 Erlang 虚 拟 机 提供 ， 而 非 操 作 系 统 或 任何 的 外 部 库 。 在 大 多 数 顺 友 编 
程 语言 里 ， 并 发 性 都 是 以 接口 的 形式 提供 ， 指 癌 主 机 操作 系统 的 内 部 并 发 函数 。 

区 分 基于 操作 系统 的 并 发 和 基于 语言 的 并 发 很 重要 , 因为 如 果 使 用 基于 操作 系统 的 并 发 , 那 
么 程序 在 不 同 的 操作 系统 上 束 会 有 不 同 的 工作 方式 。Erlang 的 并 发 在 所 有 操作 系统 上 都 有 看 相同 
的 工作 方式 。 要 用 Erlang 编 写 并 发 程序 ， 只 需 和 掌握 Erlang， 而 不 必 稳 握 操作 系统 的 并 发 机 制 。 

在 Erlang 里 ,进程 和 并 发 是 我 们 可 以 用 来 定型 和 解决 问题 的 工具 。 这 让 细 粒 度 控制 程序 的 并 
发 结构 成 为 可 能 ， 而 用 操作 系统 的 进程 是 很 难 做 到 的 。 


































































































1.5 小结 


本 草 介 绍 了 本 书 的 中 心 主 题 ， 讨论 了 用 并 发 的 方法 编写 高 性 能 、 可 扩展 和 容错 的 软件 , 但 并 
未 涉及 如 何 实现 这 一 切 的 细节 。 在 下 一 章 ， 我 们 会 快速 洲 历 Erlang， 并 编写 第 一 个 并 发 程序 。 

















在 这 一 章 里 ， 我 们 会 创建 第 一 个 并 发 程序 。 制 作 一 个 文件 服务 硕 ， 使 其 拥有 两 个 并 发 进程 : 
一 个 进程 代表 服务 各 ， 男 一 个 代表 客户 闹 。 

我 们 将 从 一 个 小 的 Erlang 子 集 着 手 ， 这 样 就 能 展示 一 些 总 体 的 原则 ， 而 不 会 在 细 市 中 挣扎 。 
但 至 少 要 理解 如 何在 shell 里 运行 代码 和 编译 模块 。 作 为 起 步 了 解 这 些 就 够 了 。 

学 习 Erlang 的 最 佳 方式 是 把 示例 输入 运行 中 的 Erlang 系 统 ， 看 看 你 是 否 能 复制 书 里 的 内 容 。 
要 安装 Erlang， 请 访问 http://joearms.github.com/installing.html。 尺 量 让 安装 指南 保持 最 新 的 状态 ， 
这 有 点 困难 ， 因 为 有 许多 不 同 的 平台 ,它们 的 配置 也 多 种 多 样 。 如 果 指 南 出 错 或 者 过 时 了 ,请 发 
送 一 封 邮 件 到 Erlang 的 邮件 列表 ， 我 们 会 尽力 提供 帮助 。 





























2.1 Shell 

你 的 大 多 数 时 间 会 花费 在 Erlang 的 sheli 里 。 输 入 一 条 表达 式 ，shell! 就 会 执行 这 条 表达 式 并 显 
示 出 结 

$ erl 


Erlang R16B ... 

Eshell V5.9 (abort with ~^G) 
1> 123456 * 223344. 
27573156864 


那么 ,上面 发 生 了 什么 ?$ 是 操作 系统 提示 符 。 输 入 的 命令 erl 启 动 了 Erlang shell。 Erlang shell 
以 横幅 信息 和 计数 提示 符 1> 作 为 啊 应 。 然 后 输入 一 个 表达 式 , 并 得 到 了 执行 和 显示 。 请 注意 每 一 
条 表达 式 都 必须 以 一 个 句号 后 接 一 个 空白 字符 结尾 。 在 这 个 上 下 文 环 境 里 ,空白 是 指 空格 、 制 表 
( Tab ) 或 者 回 车 符 。 

初学 者 经 浓 会 忘记 用 句号 加 空白 来 结束 表达 式 。 可 以 把 命令 想象 成 瑞 语 句子 。 英 语句 子 通 稍 
以 句号 结尾 ， 所 以 很 容易 记 住 。 





GD 类 似 于 Windows 操 作 系统 的 命令 行 界 面 。 一 一 译 者 注 





1 大 
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2.1.1 = 操作 符 
可 以 用 = 操作 符 给 变量 赋值 ( 严格 来 说 是 给 变量 绑 定 一 个 值 )， 就 像 这 样 : 














2> X = 123. 

123 

3> X * 2。 

246 

如 条 试图 改变 变量 的 什 ， 奇 怪 的 事情 就 会 发 生 。 
4> X = 999， 


** exception error: no match of right hand side value 999 


这 是 第 一 件 让 人 惊 厨 的 事 。 不 能 重新 绑 定 变量 。Erlang 是 一 种 痕 数 式 语言 ， 所 以 一 旦 定义 了 
X = 123， 那 么 X 永 远 就 是 123， 不 允许 改变 ! 

不 必 担 心 , 这 其 实 是 一 个 优点 ， 而 不 是 问题 。 相 比 那些 同一 个 变量 可 以 在 程序 生命 周期 里 获 
得 多 个 不 同 值 的 程序 ， 变 量 一 旦 设置 就 不 能 改动 的 程序 要 容易 理解 得 多 。 

当 看 到 一 个 表达 陈 像 X = 123 时 ， 它 的 意思 看 似 “ 将 整数 123 赋 予 变量 X” ， 但 这 种 解 谈 是 不 
正确 的 。= 不 是 一 个 赋值 操作 符 ， 它 实际 上 是 一 个 模式 匹配 操作 符 。 详 情 请 参见 3.3.2 市 。 

与 其 他 函数 式 编 程 语言 一 样 , Erlang 的 变量 只 能 绑 定 一 次 。 绑 定 变量 的 意思 是 给 变量 一 个 什 ， 
一 旦 这 个 值 被 绑 定 ， 以 后 就 不 能 改动 了 。 

如 果 你 习惯 了 命令 式 语言 , 可 能 会 对 这 个 概念 感到 不 可 思议 。 在 命令 式 语言 里 , 变量 其 实 是 
伪装 起 来 的 内 存 地 址 。 某 个 程序 里 的 Xx 其 实 就 是 内 存 某 处 的 数据 项 地 址 。 定 义 X=12 时 ， 改 变 的 是 
地 址 X 处 的 内 存 值 ， 但 在 Erlang 里 ， 变 量 X 代 表 的 是 一 个 永远 不 能 改变 的 值 。 


2.1.2 ”变量 和 原子 的 语法 


请 注意 Erlang 的 变量 以 大 写字 母 开 头 。 所 以 X、This 和 A_Long_name 都 是 变量 。 以 小 写字 母 
开头 的 名 称 〈 比 如 monday 或 friday ) 不 是 变量 ,而 是 符号 和 常量， 它们 被 称 为 原子 ( atom )。 

如 采 你 在 任何 时 候 看 到 或 写 出 像 x = 123 这 样 的 表达 式 〈 注 : 这 里 的 x 是 小 写 的 ， 如 采 没 有 
注意 到 的 话 )， 那 么 几乎 可 以 肯定 这 是 一 个 错误 。 如 果 在 shell 里 这 么 做 ,会 立即 得 到 应 答 。 

了 > abc=123, 

** exception error: no match of right hand side value 123 

但 如 有 果 这 样 一 行 表达 式 深 深 隐 藏 在 代码 里 面 , 就 可 能 会 让 程序 崩 浸 ,所 以 要 小 心 。 大 多 数 编 
辑 硕 〈 比如 Emacs 和 和 Eclipse 编辑 侣 ) 会 用 不 同 的 颜色 显示 代码 里 的 原子 和 变量 ， 所 以 区 分 它们 很 
容易 。 

在 阅读 下 一 节 之 前 ， 请 试 着 启动 shell 并 输入 一 些 简单 的 算术 表达 式 。 在 当前 阶段 ， 如 果 哪 里 
出 了 问题 ， 只 需要 输入 ControL+C 后 接 a (代表 “abort"， 即 中 止 ) 来 退出 shell， 然 后 从 操作 系统 
提示 符 处 重 局 shell 即 可 。 

我 们 了 解 了 如 何 局 动 和 停止 shell, 并 用 它 来 执行 简单 的 表达 式 。 还 看 到 了 函数 式 编程 语言 与 
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命令 式 编程 语言 的 根本 区 别 。 在 也 数 式 语言 里 ， 变 量 不 能 改变 ， 在 命令 式 语言 里 却 可 以 。 
2.2 进程、 模块 和 编译 
Erlang 程 序 是 由 许多 并 行 的 进程 构成 的 。 进 程 负 员 执 行 模块 里 定义 的 函数 。 模块 则 是 扩展 名 
为 .erL 的 文件 ,运行 前 必须 先 编译 它们 。 编 译 某 个 模块 之 后 ,就 可 以 在 shell 或 者 直接 从 操作 系统 


环境 的 命令 行 里 执行 该 模块 中 的 函数 了 。 
下 面 儿 市 将 介绍 如 何在 shell 或 操作 系统 命令 行 里 编译 模块 和 执行 限 数 。 


nf 




















2.2.1 在 shell 里 编译 并 运行 Hello World 
请 制作 一 个 这 有 以 下 内 容 的 heLLo .erl 文 件 : 


hello.erl 


-module (hello). 
-export( [start/0]). 


start() -> 
io'format("Hello world~n"), 


为 了 编译 并 运行 它 ， 我 们 从 保存 heLLo ,ert 的 目录 里 启动 Erlang shell， 然 后 执行 下 面 的 操作 : 


$ erl 

Erlang R16B ... 
了 > c(hello). 
{ok,hello} 

2> hello:start(). 
Hello world 

ok 

3> halt!(). 

$ 


c(hello) 命 令 编 泽 了 hello.erl 文 件 里 的 代码 。{ok，hell0} 的 意思 是 编译 成 功 。 现 在 代 
码 已 准备 好 运行 了 。 第 2 行 里 执行 了 hello:start() 隐 数 。 第 3 行 里 停 直 了 Erlang shell。 

在 shell 里 进行 操作 的 优点 是 只 要 平台 为 Erlang 所 文 持 ， 这 种 编译 和 运行 程序 的 方法 就 一 定 可 
用 。 在 操作 系统 的 命令 行 里 的 操作 可 能 会 因 平台 的 不 同 而 有 所 差别 。 











2.2.2 ”在 Erlang shell 外 编译 
也 可 以 在 操作 系统 的 命令 行 里 编译 和 运行 前 一 个 例子 中 的 代码 ， 就 像 下 面 这 样 : 


$ erlc hello.erl 
$ erl -noshell -s hello start -s init stop 
Hello world 


erlc 从 命令 行 启动 了 了 Erlang 编译 各 。 编 译 絮 编译 了 hello.erl 里 的 代码 并 生成 一 个 名 为 
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hello.beam 的 目标 代码 文件 。 

$erl -noshell .. .命令 加 载 了 hetLtLo 模 块 并 执行 heLLo:start () 函 数 。 随 后 ， 它 执行 了 
init:stop()， 这 个 表达 式 终止 Erlang 会 话 。 

在 Erlang shell 之 外 运行 Erlang 编 译 硕 (ertc ) 是 编 幸 Erlang 代 码 的 首选 方式 。 可 以 在 Erlang shell 
里 编译 模块 ， 但 要 这 人 么 做 必须 首先 启动 Erlang shell。 使 用 ertlc 的 优点 在 于 自动 化 。 我 们 可 以 在 
rakefile 或 makefile 内 运行 ertLc 来 自动 化 构建 过 程 。 

刚 开 始 学 习 Erlang 时 ， 建 议 你 用 Erlang shel 进 行 所 有 的 操作 ， 这 样 就 能 熟悉 编译 和 运行 代码 
的 细节 。 高 级 用 户 会 更 喜欢 目 动 编译 ， 对 Erlang shell 的 使 用 也 会 变 少 。 


2.3 你 好 ， 并 发 


我 们 已 经 了 解 了 如 何 编 详 单个 模块 。 那 么 如 何 编写 并 发 程序 呢 ? Erlang 的 基本 并 发 单元 是 进 
程 ( process )。 一 个 进程 是 一 个 轻 量 级 的 虚拟 机 ， 只 能 通过 发 送 和 接收 消息 来 与 其 他 进程 通信 。 
如 打 你 想 让 一 个 进程 做 点 什么 ， 就 要 给 它 发 送 一 个 消息 ， 还 可 能 需要 等 待 答复 。 

将 要 编写 的 第 一 个 并 发 程序 是 一 个 文件 服务 胡 。 要 在 两 全 机 天 之 间 传 输 文件 ,需要 两 个 程序 : 
第 一 台 机 带 上 运行 的 客户 关 和 第 二 合 机 从 上 运行 的 服务 大。 为 了 实现 这 一 点 , 我 们 将 制作 两 个 模 


块 . afile client 和 afile server。 












































2.3.1 文件 服务 器 进程 


文件 服务 需 由 一 个 名 为 afiLe server 的 模块 实现 。 这 里 再 提醒 一 下 ， 进 程 和 模块 类 似 于 对 
象 和 类 。 用 于 进程 的 代码 包含 在 模块 里 ， 要 创建 一 个 进程 ， 需 要 调用 spawn(...)， 创建 进程 的 
实际 操作 由 这 个 基本 函数 完成 。 











afile_ server.erl 


-module(afile server). 
-export([start/1, loop/1]). 


start(Dir) -> spawn(afile server, loop, [Dir]). 


loop(Dir) -> 
receive 
{Client, list dir} -> 
Client ! {self(), file:list dir(Dir)}; 
{Client, {get file, File}} -> 
Full = filename:]jJoin(Dir, File), 
Client ! {self(), file:read file(Full)} 
end, 
Loop(Dir). 


这 上 段 代 码 的 结构 非 弟 人 镜 单 。 如 采 上 略 去 大 部 分 细 方 ， 它 看 起 来 束 会 像 这 样 : 
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loop(Dir) -> 
%% 等 待 指令 
receive 
Command -> 


… 做 点 什么 … 
end, 


loop (Dir), 
这 就 是 用 Erlang 编 写 无 限 循 环 的 方法 。 变 量 Dir 包 含 了 文件 服务 器 当前 的 工作 目录 。 我 们 在 
这 个 循环 内 等 待 指令 ， 接 收 到 指令 时 我 们 会 遵从 ， 然 后 再 次 调用 自身 来 获取 下 一 个 指令 。 
答疑 解 惑 ”不 用 担心 最 后 的 自身 调用 ， 这 不 会 耗 尽 栈 空 间 。Erlang 对 代码 采用 了 一 种 所 谓 “ 尾 
部 调用 ”的 优化 , 意思 是 此 函数 的 运行 空间 是 国定 的 。 这 是 用 Erlang 编 写 循 环 的 标准 
方式 ， 只 要 在 最 后 调用 自身 即 可 。 





羽 一 点 要 注意 的 是 ，Loop 力 数 永 远 不 会 返回 。 在 顺序 编程 语言 里 ， 必 须要 极其 小 心 避免 无 
限 循环 ， 因 为 只 有 一 条 控制 线 ， 如 有 果 这 条 线 卡 在 循环 里 就 有 麻烦 了 。Erlang 则 没有 这 个 问题 。 服 
务 骨 只 是 一 个 在 无 限 循环 里 处 理 请 求 的 程序 ， 与 我 们 想 要 执行 的 其 他 任务 并 行 运行 。 

现在 仔细 查看 接收 语句 。 回 忆 一 下 ， 它 看 起 来 束 像 这 样 : 


afile_server.erl 














receive 
{Client, tiist dir} -> 
Client ! {self(), file:list dir(Dir)}; 
{Client, {get file, File}} -> 
Full = filename:]join{(Dir, File), 
Client ! {self()}, file:read file(Full)} 
end, 


这 段 代 码 的 意思 是 如 条 接收 到 {CLient，List_dir}y 消 息 ， 就 应 该 回复 一 个 文件 列表 ; 如 采 
接收 到 的 消息 是 {CLient,，{get_fiLe，FiLe}}, 则 回复 这 个 文件 。 作 为 模式 匹配 过 程 的 一 部 分 ， 
CLient 变 量 在 收 到 消息 时 会 被 绑 定 。 
这 段 代码 非常 紧 浴 ， 所 以 很 容易 忽略 所 发 生 的 细 方 。 这 段 代码 里 有 三 个 要 点 需要 加 以 注意 。 
@ 回复 给 谁 
所 有 接收 的 消息 都 包含 变量 CLient , 它 是 发 送 请 求 进程 的 进程 标识 符 , 也 是 应 该 回复 的 对 象 。 
如 果 想 要 得 到 一 条 消息 的 回复 ， 最 好 说 明 一 下 回复 应 该 发 给 谁 。 就 像 在 信件 里 写 明 姓名 
和 地 址 ， 如 果 不 说 明 信 件 来 自 何 处 ， 就 永远 得 不 到 回复 。 
@ self() 的 用 法 
服务 器 发 送 的 回复 包含 了 参数 self() (在 这 个 案例 里 seLf () 是 服务 顺 的 进程 标识 符 )。 
这 个 标识 符 被 附 在 消息 中 ， 使 客户 端 可 以 检查 收 到 的 消息 的 确 来 目 服务 磊 ， 而 不 是 其 他 
某 个 进程 。 

@ 模式 匹配 被 用 于 选择 消息 
接收 语句 内 部 有 两 个 模式 。 可 以 这 样 编写 : 
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receive 
Patternl -> 
AcCctions1l; 
Pattern2 -> 
Actions2 -> 


end 


Erlang 编 译 希 和 运行 时 系统 会 正确 推断 出 如 何在 收 到 消 县 时 运行 适当 的 代码 。 不 需要 编写 任 
何 的 if-then-eLse 或 switch 语 句 来 设 定 该 做 什么 。 这 是 模式 匹配 市 来 的 乐趣 之 一 ， 会 为 你 节省 
大 量 工 作 。 

可 以 像 下 面 这 样 在 shell 里 编译 和 测试 这 段 代 码 : 


1> c(afile server). 
{ok,afile server} 
2> FileServer = afile server:start("."). 
<O ,47.0> 
3> FileServer ! {self(), list dir}. 
{<0.31.0>, List dir} 
4> receive X -> X end. 
{<0.47.0>, 
{ok, ["afile server.beam","processes.erl","attrs.erl","lib find.erl", 
"dist demo.erl","datal.dat","scavenge urls,.erl","testl.erl", 


..]}} 
来 看 看 相关 细 市 。 


1> c(afile server). 
{ok,afile server} 


编译 afile server.erl 文 件 所 包含 的 afile server 模 块 。 编 译 很 成 功 ， 所 以 “编译 ” 渗 
数 c 的 返回 值 是 {ok，afile server}。 


2> FileServer = afile server:start(",."). 
<0 .47.0> 


afile server:start(Dir) 调 用 spawn(afile server，Loop，[Dir])。 这 就 创建 出 一 个 
新 的 并 行进 程 来 执行 函数 afile server:Loop(Dir) 并 返回 一 个 进程 标识 符 , 可 以 用 它 来 与 此 进 
程 通信 。 

<0.47.0> 是 文件 服务 硕 进 程 的 进程 标识 符 。 它 的 显示 方式 是 尖 括 号 内 由 句 吕 分 隔 的 三 个 整数 。 

















注意 ”每 次 运行 这 个 程序 时 ， 进 程 标识 符 都 会 改变 。 因 此 ，<0.47.0> 里 的 数字 在 不 同 的 会 话 里 
写 
不 


3> FileServer ! {self(), list dir}. 
{<0.31.0>, list dir} 


给 文件 服务 器 进程 发 送 了 一 条 {fseLf()，List dir} 消 息 。Pid ! Message 的 返回 值 被 
规定 为 Message， 因 此 shell 打 印 出 {fseLf(),List dir} 的 值 ， 即 {<0.31.0>,，list dir}。 
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<0.31.0> 是 Erlang shell 目 号 的 进程 标识 符 ， 它 被 包括 在 消息 内 ， 告 知 文件 服务 如 应 该 回复 给 谁 。 


4> receive X -> X end. 

{<0.47 .0>， 

{ok,["afile server.beam","processes.erl","attrs.ert","lib find,.erl", 
"dist demo.erl","datal.dat","scavenge urls.erl","testl.erl'", 


.1]} 
receive X -> X end 接 收文 件 服 务 冀 发 送 的 回复 。 它 返回 元 组 {<0.47.0>,， {ok，...}。 
该 元 组 的 第 一 个 元 素 <0.47.0> 是 文件 服务 右 的 进程 标识 符 。 第 二 个 参数 是 file:1list dir(Dir) 
男 数 的 返回 值 ， 它 在 文件 服务 俘 进 程 的 接收 循环 里 得 出 。 





2.3.2 ”客户 站 代码 

文件 服务 需 通 过 一 个 名 为 afite_cLient 的 客户 端 模块 进行 访问 。 这 个 模块 的 主要 目的 是 为 
了 隐藏 底层 通信 协议 的 细节 。 客 户 端 代码 的 用 户 可 以 通过 调用 此 客户 端 模 块 导 出 的 Ls 和 
get fiLe 国 数 来 传输 文件 。 这 就 能 够 自由 改变 底层 的 协议 而 不 会 影响 到 客户 端 代 码 API 部 分 。 














afile_client.erl 


-module(afile client). 
-export{[ls/1, get file/2]1). 


ls(Server) -> 
Server | {self(), list dir}, 
receive 
{Server, FileList} -> 
FileList 
end. 


get file(Server, File) -> 
Server ! {self{(}, {get file, File}}, 


receive 
{Server, Content} -> 
Content 
end. 
如 果 对 比 afile_clien 与 afile_server 的 代码 ， 就 会 发 现 一 种 美妙 的 对 称 性 。 只 要 客户 辛 
里 有 Server ! ... 这 类 send 语 句 ， 服 务 硕 里 就 会 有 receive 模 式 ， 反 之 炙 然 。 
receive 


{Client, Pattern} -> 
end , 
现在 要 重 局 shell 并 重新 编译 所 有 代码 ， 展 示 客 户 病 和 服务 天 如 何 共同 工作 。 


1> c(afile server). 
{ok,afile server} 
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2> c(afile client). 

{ok,afile client} 

3> FileServer = afile server:start("."). 

<0O ,43.0> 

4> afile client:get file(FileServer,'"missing"). 

{terror,enoent} 

5> afile client:get file(FileServer,"afile server.erl"). 

{ok,<<"-module(afile server).\n-export([start/1])....} 

现在 在 shell 里 运行 的 代码 和 之 前 代码 的 唯一 区 别 ， 是 把 接口 程序 抽象 出 来 放 入 单独 的 模块 
里 。 我 们 隐藏 了 客户 端 和 服务 天 之 间 消 息 传 递 的 细节 ， 因 为 没有 其 他 程序 对 此 感 兴趣 。 

到 目前 为 止 ,你 看 到 了 一 个 完整 文件 服务 硕 的 基础 部 分 , 但 它 尚 未 完成 。 还 有 很 多 的 细 市 问 
题 ， 涉 及 局 动 和 停止 服务 硕 、 连 接 某 个 套 接 字 〈socket ) 等 ， 在 这 里 不 会 提 及 。 

从 Erlang 的 角度 看 , 如 何 局 动 和 俘 止 服务 硕 , 连接 套 接 字 , 从 错误 中 恢复 等 都 是 珊 科 的 细节 。 
问题 的 本 质 在 于 创建 并 行进 程 ， 以 及 发 送 和 接收 消息 。 

在 Erlang 里 用 进程 来 构建 问题 的 解决 方案 。 思 考 进 程 的 结构 ( 也 就 是 说 哪些 进程 间 相 互 有 联 
系 )， 思 考 进 程 间 传递 的 消息 以 及 消息 包含 何 种 信息 是 思考 和 编程 方式 的 中 心 。 


2.3.3 ”改进 文件 服务 器 


我 们 开发 的 文件 服务 需 包 括 了 运行 在 同一 台 机 顺 上 的 两 个 相互 通信 的 进程 ,展示 了 编写 并 发 
程序 所 需 的 一 些 基本 要 素 。 对 真正 的 服务 融 而 言 ， 客 户 端 和 服务 需 会 运行 在 不 同 的 机 带 上 ， 所 以 
必须 设法 让 进程 间 的 消息 不 仅 能 在 同一 个 Erlang 下 点 的 进程 之 间 传 递 ， 也 能 在 物理 上 隅 开 的 机 硕 
上 的 Erlang 进 程 之 间 进 行 。 

第 17 章 会 介绍 如 何 将 TCP 传 输 层 用 于 进程 通信 ， 而 14.4.2 方 将 介绍 如 何 直 接 用 分 布 式 Erlang 
实现 文件 服务 硕 。 

在 这 一 章 里 , 我 们 了 解 了 如 何在 shell 里 执行 一 些 简 单 的 操作 , 编译 一 个 模块 ,以 及 用 spawn、 
send 和 receive 这 三 个 基本 国 数 创建 一 个 简单 的 双 进 程 并 发 程序 。 

这 就 是 本 书 的 第 一 部 分 。 第 二 部 分 会 更 详细 地 讨论 顺序 编程 , 直到 第 12 章 再 回 到 并 发 编程 上 
来 。 在 下 一 章 ， 我 们 将 开始 学 习 顺 序 编 程 ， 详 细 了 解 shell、 模 式 匹 配 和 Erlang 的 基本 数据 类 型 。 

























































































2.4 练习 


现在 也 许 是 个 好 机 会 来 检查 一 下 你 对 目前 所 做 的 有 几 分 了 解 。 

(1) 启动 并 停止 Erlang shell。 

(2) 在 Erlang shell 里 输入 一 些 命 令 。 不 要 忘 了 以 句号 和 空 日 结束 命令 。 

(3) 对 hello.erl 做 一 些小 小 的 改动 。 在 shell 里 编译 并 运行 它们 。 如 果 有 错 ， 中 J 上 Erlang shell 
并 重启 shell。 

(4) 运行 文件 客户 端 和 服务 器 代码 。 加 入 一 个 名 为 put_file 的 命令 。 你 需要 添加 何 种 消息 ? 
学 习 如 何 查 阅 手 册页 。 查 阅 手册 页 里 的 file 模 块 。 








”第 二 部 分 
顺序 编程 





本 部 分 涉及 如 何 编写 顺序 的 Erlang 程序 。 我 们 将 
介绍 所 有 的 顺序 Erlang 知识 ， 讨 论 编译 和 运行 程序 的 
各 种 方法 ， 以 及 用 类 型 系统 来 描述 Erlang 函数 的 类 型 
和 静态 检测 编程 错误 。 








基本 概念 





这 一 章 是 Erlang 编 程 的 基础 。 无 论 是 并 行 还 是 顺序 ， 所 有 的 Erlang 程 序 都 会 用 到 模式 匹配 、 
ee er en 

在 这 一 章 里 ， 我 们 会 用 Erlang shell 对 系统 做 一 些 答 试 ， 看 看 它 有 什么 样 的 行为 。 首 先 介 绍 
shell, 








3.1 启动 和 停止 Erlang shell 


在 Unix 系 统 (包括 MacOSX ) 里 , 需要 从 命令 提示 里 启动 Erlang shell; 在 Windows 系 统 里 则 
是 点 击 Window 开 始 亲 单 里 的 Erlang 图 标 。 

$ erl 

Erlang Ri6B (erts-5.10.1) [source} {64-bit} {smp:4:4] [async-threads:10] 

[hipe] [kernel-poll:falsel 

Eshell V5.10.1 (abort with 人 人 G) 

了 > 

这 是 启动 Erlang shell 的 Unix 命 令 。shell 以 横幅 信息 作为 啊 应 ， 告 诉 你 正在 运行 哪个 版 本 的 
Erlang。 停 止 系统 最 简单 的 方式 是 按 Ctrl+C ( Windows 里 是 Ctrlt+Break" ) 后 接 a (“abort” 的 简写 )， 
就 像 下 面 这 样 : 

BREAK: (a)bort (ciontinue (piroc info (i)nfo (Lioaded 

(v)ersion (k)ill (D)b-tables (d)istribution 








9 


$ 


输入 a 会 立即 停止 系统 , 这 可 能 导致 某 些 数据 的 损坏 。 要 实现 受 控 关 闭 , 可 以 输入 q() (“guit” 
的 简写 )。 


1> gq(). 
ok 


$ 


QD 即 键盘 上 的 “PauselBreak” 键 。 一 一 译 者 注 
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这 样 就 以 一 种 受 控 的 方式 停止 了 系统 。 所 有 打开 的 文件 都 被 刷 和 人 缓存 并 关闭 ,数据 库 ( 如 果 
正在 运行 的 话 ) 会 被 停止 , 所 有 的 应 用 程序 都 以 有 序 的 方式 关 停 。q() 是 init:stop() 命 令 在 shell 
里 的 别名 。 

要 立即 停止 系统 ， 应 执行 表达 式 erlang:halt()。 

如 果 这 些 方法 都 不 管用 ， 请 阅读 10.4.1 节 的 相关 内 容 。 








3.1.1 在 shell 里 执行 命令 


当 shell 准 备 好 接受 表达 式 时 ， 会 打印 出 命令 提示 。 


1> X = 20. 
20 


这 次 对 话 从 命令 1 开始 ( 也 就 是 shell 打 印 出 的 1> )。 它 的 意思 是 启动 了 一 个 新 的 Erlang shell。 
每 当 在 本 书 里 看 到 以 1> 开 涉 的 对 话 时 , 就 必须 启动 一 个 新 的 shell 才 能 准确 再 现 本 书 里 的 示例 。 当 
某 个 示例 以 大 于 1 的 提示 数字 开头 时 ， 就 暗示 此 shell 会 话 是 之 前 示例 的 延续 ， 此 时 无 需 局 动 新 
shell。 

在 提示 处 输入 一 个 表达 式 。shell 执 行 了 这 个 表达 式 并 打印 出 结 


2> X + 20. % and this is a comment 
40 


shel] 又 打印 出 了 一 个 提示 ， 这 一 次 是 用 于 表达 式 2 (因为 每 次 输入 一 个 新 表达 式 ， 命 令 数字 
就 会 增加 )。 

在 第 2 行 里 ， 百 分 号 字符 ( % ) 代表 一 上 段 注释 的 起 点 。 从 百 分 写 到 行 尾 的 所 有 文字 都 被 当 作 
注释 ，shell 和 和 Erlang 编译 大 会 忽略 它们 。 

现在 也 许 是 拿 shell 来 做 实验 的 好 机 会 。 请 按照 书 中 文字 的 显示 方式 准确 输入 示例 里 的 这 些 表 
达 式 , 然后 检查 是 否 得 到 了 与 本 书 相 同 的 结果 。 有 些 命 令 序列 可 以 多 次 输入 ,而 其 他 的 只 能 输入 
一 次 ， 因 为 它们 依赖 于 之 前 的 命令 。 如 果 任 何 地 方 出 了 错 ， 最 好 的 方法 是 中 上 上 shell， 然 后 新 开 一 
个 shell 重 试 。 





























3.1.2 ”可 能 出 错 的 地 方 


你 不 能 把 在 本 书 里 读 到 的 一 切 都 输 进 shell 里 。Erlang 模 块 里 的 语法 形式 不 是 表达 式 ， 不 能 被 
shell 理 解 。 具 体 来 说 ， 不 能 在 shell 里 输入 附注 ， 附 注 是 以 连 字 符 开头 的 事物 (例如 -module 和 
-export )。 

另 一 个 可 能 出 错 的 地 方 是 , 已 开始 输入 一 些 引 号 内 文学 (也 就 是 以 单 引 号 或 双 引 号 开头 ) 但 
尚未 输入 与 开始 引号 相 匹 配 的 结束 引号 。 

如 果 这 些 错误 发 生 了 ,最 好 的 做 法 是 输入 一 个 额外 的 结束 引号 ,后 接 句 号 和 空白 来 完成 命令 。 

高 级 技巧 : 可 以 启动 和 停止 多 个 shell。 详 情 请 参见 10.4.3 节 。 
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3.1.3 ”在 Erlang shell 里 编 革 


Erlang shell 包 含 一 个 内 建 的 行 编辑 需 。 


它 能 部 分 理解 流行 的 Emacs 编辑 器 所 使 用 的 行 编辑 命 








令 。 只 需 按 几 次 键 就 能 重新 调用 和 编辑 之 前 的 行 。 下 面 展示 了 可 用 的 命令 ( 注意 ^Key 的 意思 是 应 


该 按 下 Ctrlt+Key ): 
命 ” 令 

人 ^A 

^D 

SE 

^F 或 右 箭头 键 
“或 左 箭头 键 
^P 或 上 箭头 键 
^N 或 下 箭头 键 
^T 

Tab 


说 明 
行 首 
删除 当前 字符 
行 尾 
阿 前 的 字符 
阿 后 的 字符 
前 一 行 
平一 全 
调换 最 近 两 个 字符 的 位 置 
符 试 扩展 当前 模块 或 函数 的 名 称 








使 用 经 验 越 来 越 丰富 后 ,你 会 明日 shell 真 的 是 一 个 很 强大 的 工具 。 最 棒 的 是 ， 当 开始 编写 分 
布 式 程序 时 ， 你 会 发 现 可 以 挂 接 一 个 shell 到 集群 里 为 一 个 Erlang 广 上 太 上 运 行 的 Erlang 系 统 ， 其 全 
还 可 以 生成 一 个 安全 shell ( secure shell， 即 ssh ) 直接 连接 远程 计算 机 上 运行 的 Erlang 系 统 。 通 过 
它 ， 可 以 与 Erlang 节 点 系统 中 任何 节点 上 的 任何 程序 进行 交互 。 


3.2 简单 的 整数 运算 











先 来 计算 一 些 算 术 表 达 式 的 值 。 


1]>2+3+* 4. 
14 

2> (2 + 3) * 4. 
20 











你 会 看 到 Erlang 这 循 算术 表达 式 的 一 般 规 则 ， 因 此 2 + 3 * 4 的 意思 是 2 + (3 * 4) ， 而 不 


是 (2 + 3) * 4。 








Erlang 可 以 用 任意 长 度 的 整数 执行 整数 运算 。 在 Erlang 里 ， 整 数 运算 是 精确 的 ， 因 此 无 需 担 
心 运算 游 出 或 无 法 用 特定 字 长 (word size ) 来 表示 某 个 整数 。 
为 什么 不 试 试 呢 ?你 可 以 计算 一 些 非常 大 的 数字 来 癌 朋 友 炫 炊 一 下 。 


3> 123456789 * 987654321 * 112233445566778899 * 998877665544332211. 
13669560260321809985966198898925761696613427909935341 


可 以 用 多 种 方式 输入 整数 (详情 参见 8.19.1 市 )。 下 面 这 个 表达 式 使 用 了 十 六 进 制 和 三 十 二 进 


制 的 记 数 法 : 
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4> 1l6#cafe * 32#sugar. 
1577682511434 
= 
3.3 ”变量 





可 以 把 某 个 命令 的 结果 保存 在 变量 里 。 


1> X = 123456789. 
123456789 


在 第 1 行 里 给 变量 x 指派 一 个 值 ，shell 在 下 一 行 里 打印 出 了 这 个 变量 的 值 。 
请 注意 所 有 变量 名 都 必须 以 大 写字 母 开 头 。 
如 打 想 知道 一 个 变量 的 值 ， 只 需要 输入 变量 名 。 




















2> 共 ， 

123456789 

X 既 然 已 经 有 一 个 值 了 ， 就 可 以 使 用 它 。 
3> X*+X*X*X. 


232305722798259244150093798251441 
但 是 ， 如 采 试 图 给 变量 X 指 派 一 个 不 同 的 值 ， 就 会 得 到 一 条 错误 消息 。 


4> X = 1234. 
** exception error: no match of right hand side valuyue 1234 


一 次 性 赋值 就 像 是 代数 
记得 上 党 的 时 候 ， 数 学 老师 曾 说 过 :;“ 如 果 一 个 等 式 中 有 好 几 处 人 了， 那么 所 有 都 是 一 样 
的 .” 我 们 就 是 这 么 解 方程 的 : 如 果 知 道生 10 且 XY 半 2>， 那 么 这 两 个 等 式 里 的 XX 就 都 等 于 6， 


yA 4 
但 当 我 学 习 我 的 第 一 门 编 程 语言 时 ， 看 到 的 却 是 这 个 : 
X=X+1 


所 有 人 都 在 抗议 ,说 :“ 这 是 不 可 能 的 1” 但 是 老师 说 是 我 们 错 了 ， 我们 必须 忘记 数学 课 
里 学 到 的 那些 。 

在 Erlang 里 ， 变 量 就 像 数学 里 的 那样 。 当 关联 一 个 值 与 一 个 变量 时 ， 所 下 的 是 一 种 断言 ， 
也 就 是 事实 陈述 。 这 个 变量 具有 那个 值 ， 仅 此 而 已 。 





为 了 解释 这 里 发 生 了 什么 ， 我 不 得 不 破坏 对 X = 1234 这 条 简单 语句 所 这 有 的 两 种 假定 。 
口 首先 ，X 不 是 一 个 变量 ， 不 是 你 习惯 的 Java 和 C 等 声言 里 的 概念 。 

口 其 次 ，= 不 是 一 个 赋值 操作 符 ， 而 是 一 个 模式 匹配 操作 符 。 

这 多 半 是 你 初学 Erlang 时 遇 到 的 最 难 异 的 部 分 之 一 ， 所 以 我 们 来 深入 探讨 一 下 。 
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3.3.1 Erlang 的 变量 不 会 变 


Erlang 的 变量 是 一 次 性 赋值 变量 (single-assignment variable )。 顾 名 思 义 ,它们 只 能 被 赋值 一 
次 。 如 有 果 试 图 在 变量 被 设置 后 改变 它 的 值 ， 就 会 得 到 一 个 错误 (事实 上 ， 你 将 得 到 的 是 我 们 刚 
才 看 到 的 “badmatch”， 即 不 匹配 错误 ) 已 被 指派 一 个 值 的 变量 称 为 绑 定 变量 ,否则 称 为 未 绑 定 


< _ 转 
本 量 。 


当 Erlang 看 到 像 X = 1234 这 样 的 一 条 语句 且 X 之 前 未 被 绑 定 时 ， 它 就 会 给 变量 X 绑 定 1234 这 
个 信 。X 在 绑 定 前 可 以 接受 任何 仁 ， 它 只 是 一 个 等 待 填充 的 空 槽 。 但 是 ， 一 旦 得 到 一 个 什 ， 就 会 
永远 保留 它 。 

此 时 此 刻 ， 你 可 能 很 想 知道 为 什么 用 变量 这 个 名 称 。 这 里 有 两 个 原因 。 

口 它们 是 变量 , 但 它们 的 值 只 能 被 改变 一 次 (也 就 是 说 , 它们 从 未 绑 定 改变 为 具有 一 个 值 )。 

口 它们 看 上 去 像 是 传统 编程 语言 里 的 变量 ， 因 此 当 看 到 像 这 样 开 头 的 一 行 代 码 时 : 

X= ..， %% ',.,， 意 指 ' 没 有 显示 的 代码 ， 
就 会 想 :“ 啊 哈 ， 我 知道 这 是 什么 。X 是 一 个 变量 ，= 是 一 个 赋值 操作 符 。” 所 以 说 X 应 该 是 
一 个 变量 ， 而 = 是 一 个 赋值 操作 符 。 

事实 上 ，= 是 一 个 模式 匹配 操作 符 ， 它 在 X 为 未 绑 定 变量 时 的 表现 类 似 于 赋值 。 

最 后 ， 变 量 的 作用 域 是 它 定义 时 所 处 的 语汇 单元 。 因 此 ， 如 果 X 被 用 在 一 条 单独 的 函数 子 句 
之 内 , 它 的 值 就 不 会 “ 逃 出 ”这 个 子 句 。 没 有 同一 吨 数 的 不 同 子 名 共享 全 局 或 私有 变量 这 种 说 法 。 
如 果 X 出 现在 许多 不 同 的 函数 里 ， 那 么 所 有 这 些 Xx 的 值 都 是 不 相干 的 。 


3.3.2 ”变量 绑 定 和 模式 匹配 


在 Erlang 里 ， 变 量 获 得 值 是 一 次 成 功 模式 匹配 操作 的 结果 。 

在 大 多 数 语言 里 ，= 表 示 一 个 赋值 语句 。 而 在 Erlang 里 ，= 是 一 次 模式 匹配 操作 。Lhs = Rhs 
的 真正 意思 是 : 计算 右 侧 (Rhs ) 的 值 ， 然 后 将 结果 与 左 侧 (Lhs ) 的 模式 相 匹 配 。 

变量 〈 比 如 X ) 是 模式 的 一 种 简单 形式 。 如 之 前 所 说 的 ， 变 量 只 能 赋值 一 次 。 我 们 第 一 次 说 
X = SomeExpression 时 ，Erlang 对 自己 说 :“ 我 要 做 些 什 么 才能 让 这 条 语句 为 真 ”” 因 为 X 还 没 
有 值 ， 它 可 以 绑 定 X 到 SomeExpression 这 个 值 上 ， 这 条 语句 就 成 立 了 。 

如 果 后 期 我 们 说 X = AnotherExpression ， 那 么 只 有 在 SomeExpression 和 Another- 
Expression 相 等 的 情况 下 匹配 才 会 成 功 。 这 里 有 一 些 例 子 : 
























































1> X = (2+4) . 

6 

X 在 这 条 语句 之 前 没有 值 ， 因 此 模式 匹配 成 功 ，X 被 绑 定 为 6。 
2> Y = 10. 

10 


类 似 地 ，Y 被 绑 定 为 10。 


De 
De 
人 
hd 


3> X= 6. 
6 


这 与 第 1 行 略 有 不 同 。 在 计算 这 个 表达 式 之 前 ，X 等 于 6， 因 此 匹配 成 功 ，shell 则 打印 出 了 这 
个 表达 式 的 值 ， 也 就 是 6. 


4> X=Y. 
** exception error: no match of right hand side value 10 


在 计算 这 个 表达 式 之 前 ，X 等 于 6，Y 等 于 10。6 与 10 不 相等 ， 因 此 会 打印 出 一 条 错误 消息 。 





5>Y= 10. 

10 

这 次 模式 匹配 成 功 ， 因 为 Y 等 于 10。 
6> Y¥ = 4. 


** exception error: no match of right hand side value 4 


这 次 失败 ， 因 为 Y 等 于 10。 

你 可 能 会 觉得 我 在 这 一 点 上 过 于 哆 唆 了 。 现 在 这 个 阶段 ，= 左 边 的 所 有 模式 都 仪 仪 是 绑 定 或 
未 绑 定 的 变量 ， 但 在 后 面 将 会 看 到 ， 我 们 可 以 制作 任意 复杂 的 模式 来 用 = 操作 符 进 行 匹 配 。 我 会 
在 介绍 元 组 和 列表 (它们 被 用 于 保存 复合 数据 项 ) 之 后 再 回 到 这 个 主题 上 。 








没有 副作用 意味 着 可 以 让 程序 并 行 

可 以 修改 的 内 存 区 域 有 个 专业 术语 叫 作 可 变 状 态 (mutable state )。Erlang 是 一 种 函数 式 编 
人 

本 书后 面 将 介绍 如 何 为 多 核 CPU 编 程 ， 看 看 不 可 变 状 态 所 带 来 的 显著 效果 。 

如 果 使 用 C 或 Java 这 些 传统 编程 语言 来 为 多 核 CPU 编 程 ， 就 不 得 不 对 付 共 享 内 存 的 问题 。 
为 了 不 破坏 共享 内 存 , 访问 时 必须 给 这 些 内 存 加 锁 。 访 问 共 享 内 存 的 程序 在 操作 共享 内 存 时 万 
万 不 可 前 涡 。 

Erlang 里 没有 可 变 状 态 ， 没 有 共享 内 存 ， 也 没有 锁 。 这 让 程序 并 行 变 得 简单 了 。 


3.3.3 为 什么 一 次 性 赋值 让 程序 变 得 更 好 


在 Erlang 里 ， 变 量 只 不 过 是 对 某 个 值 的 引用 : Erlang 的 实现 方式 用 指针 代表 绑 定 变量 ， 指 向 
一 个 包含 值 的 存储 区 。 这 个 值 不 能 被 修改 。 

不 能 修改 变量 这 一 事实 极其 重要 ， 和 C 或 Java 这 些 命令 式 语言 里 的 变量 行为 存在 区 别 。 

使 用 不 可 变 变量 简化 了 调试 工作 。 要 理解 为 什么 是 这 样 , 我 们 必须 问 目 己 错 误 是 什么 ,以 及 
错误 是 如 何 表现 出 来 的 。 

程序 出 错 的 一 个 稍 见 发 现 方式 是 我 们 看 到 茶 个 变量 有 着 意料 之 外 的 值 。 一 旦 知道 是 哪个 变量 
出 了 错 ， 就 必须 检查 程序 ， 找 到 绑 定 变量 的 地 方 。 因 为 Erlang 的 变量 是 不 可 变 的 ， 所 以 生成 此 变 
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量 的 代码 必然 是 错误 的 。 而 在 命令 式 语 言 里 ， 变 量 可 以 被 多 次 修改 ,因此 每 一 个 修改 变量 的 地 方 
部 有 可 能 是 错误 发 生 之 处 。 在 Erlang 里 则 只 需要 查看 一 处。 

此 时 此 刻 ， 你 可 能 想 知 道 : 没有 可 变 变 量 将 如 何 编 程 ” 在 Erlang 里 怎样 表达 X = X + 1 这 类 
概念 ?Erlang 的 方式 是 创建 一 个 名 字 未 被 使 用 过 的 新 变量 ( 比方 说 X1 )， 然 后 编写 Xl = X + 1。 




















3.4 浮 点 数 


让 我 们 试 春 用 浮 点 数 做 一 些 计 算 。 


1> 5/3. 
1,6666666666666667 


第 1 行 的 行 尾数 字 是 整数 3, 句号 表示 表达 式 的 结束 , 而 不 是 小 数 点 。 如 果 我 想 写 的 是 浮 点 数 ， 
我 会 写作 3 .0。 

当 你 用 /给 两 个 整数 做 除法 时 ， 结 果 会 自动 转换 成 浮上 点数 。 因 此 ，5/3 的 值 是 
1.6666666666666667。 











2> 4/2. 

2.0 

尽管 4 能 被 2 整除 ,但 是 结果 仍然 是 一 个 浮 点 数 ， 而 不 是 整数 。 要 从 除法 里 获得 整数 结 
我 们 必须 使 用 操作 符 div 和 rem。 

3> 5 div 3， 

1 

4> 5 rem 3., 

2 

5> 4 dv 2， 

2 

N div M 是 让 N 除 以 M 然 后 仿 去 余数 。N rem M 是 N 除 以 M 后 剩 下 的 余数 。 

Erlang 在 内 部 使 用 64 位 的 IEEE 754-1985 浮 点 数 ， 因 此 使 用 浮 点 数 的 程序 会 存在 和 C 等 语言 一 
样 的 浮 点 数 取 整 与 精度 问题 。 


3.5 ”原子 


在 Erlang 里 ,原子 被 用 于 表示 常量 值 。 

如 果 你 熟悉 C 或 Java 里 的 枚 举 类 型 , 或 者 Scheme 或 Ruby 里 的 符号 ,说 明 你 已 经 用 过 与 原子 非 
党 相似 的 数据 类 型 了 。 

C 程 序 员 会 很 熟悉 一 个 惯例 ， 用 符号 常量 来 让 程序 能 自我 描述 。 一 个 典型 的 C 程 序 会 在 包含 
文件 里 定义 一 组 全 局 稼 量 (这 个 文件 就 是 由 众多 篆 量 定义 组 成 的 )。 举 个 例子 ,一 个 名 为 glob.h 
的 文件 可 能 会 包含 这 些 : 














#define OP READ 1 

#define OP WRITE 2 

#define OP SEEK 3 

#define RET SUCCESS 223 

使 用 这 些 符号 常量 的 典型 C 代 码 可 能 是 这 样 的 : 


#include "glob.h" 


Int ret,; 
ret = file operation(OP READ, buff); 
if( ret == RET SUCCESS ) { ... } 


在 C 程 序 里 , 这 些 第 量 的 值 无 关 紧 要 , 而 在 这 里 它们 之 所 以 值得 注意 仅仅 是 因为 其 各 不 相同 ， 
可 以 用 来 比较 是 否 相 等 。 这 个 程序 对 应 的 Erlang 版 本 可 以 是 这 样 : 


Ret = file operation(op read, Buff), 
if 





Ret == ret success -> 








在 Erlang 里 ， 原 子 是 全 局 性 的 ， 而 且 不 需要 安定 义 或 包含 文件 就 能 实现 。 

假设 想 要 编写 一 个 对 星期 几 进行 操作 的 程序 。 有 要 实现 它 ， 我 们 会 用 monday ( 星期 一 ) 和 
tuesday (星期 二 ) 等 原子 来 代表 它们 。 

原子 以 小 写字 母 开 头 , 后 接 一 串 字 母 、 数 字 、 下 划 线 ( ) 或 at( @ ) 符 号 , 例如 red、december、 
cat、meters、yards、joe@somehost 和 a Long name。 

原子 还 可 以 放 在 单 引 号 (') 内 。 可 以 用 这 种 引号 形式 创建 以 大 写字 母 开 头 〈 否则 会 被 解释 
成 变量 ) 或 包含 字母 数字 以 外 字符 的 原子 ,例如 'Monday'、'Tuesday'、'+'、'*!' 和 'an atom 
with spaces'。 甚 至 可 以 给 无 需 引 号 的 原子 加 上 引号 ， 因 此 'a' 和 a 的 意思 完全 一 致 。 在 某 些 语 
言 里 ， 单 引号 和 双 引 号 可 以 互 换 使 用 。Erlang 里 不 是 这 样 。 单 引号 的 用 法 如 前 面 所 示 ， 双 引号 用 
于 给 字符 串 字 面 量 (string literal ) 定 界 。 

一 个 原子 的 值 就 是 它 本 身 。 所 以 ， 如 有 果 输 入 一 个 原子 作为 命令 ，Erlang shell 就 会 打印 出 这 个 
原子 的 值 。 


了 > hello. 
hello 


你 可 能 会 澳 得 讨论 原子 或 整数 的 值 有 点 奇怪 。 但 因为 Erlang 是 一 种 困 数 式 纺 程 才 言 ， 每 个 表 
达 式 乔 必须 有 一 个 值 。 这 包括 了 整数 和 原子 ， 它 们 只 不 过 是 极其 简单 的 表达 式 。 



























































3.6 ”元 组 


如 采 想 把 一 些 数量 固定 的 项 目 归 组 成 单一 的 实体 ， 就 会 使 用 元 组 〈tuple )。 创建 元 组 的 方法 
是 用 大 括号 把 想 要 表示 的 值 括 起 来 ,并 用 逗号 分 阳 它 们 。 誉 个 例子 ,如 来 想 要 表示 某 人 的 名 字 和 
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壬 高 ， 就 可 以 用 {joe，1.82}。 这 个 元 组 包含 了 一 个 原子 和 一 个 浮 点 数 。 
元 组 类 似 C 里 面 的 结构 ( struct )， 区 别 在 于 元 组 是 匿名 的 。 在 C 里 ， 类 型 为 point 的 变量 P 可 
以 这 样 声明 : 
struct point { 
int x; 
int y; 
上 
我 们 使 用 点 操作 符 来 访问 C 结 构 里 的 各 个 人 字段。 因此， 要 设置 这 个 坐标 点 的 x 和 y 什 ， 可 以 这 
人 么 与 : 





P.X = 10; P.y = 42; 
Erlang 没 有 类 型 声明 ， 因 此 要 创建 一 个 “坐标 点 ”， 只 需要 这 人 么 写 : 
P = {10, 45} 


这 样 就 创建 了 一 个 元 组 并 把 它 绑 定 到 变量 P 上 。 与 C 结 构 不 同 ， 元 组 里 的 字段 没有 名 字 。 
为 这 个 元 组 只 包 侣 一 对 整数 , 所 以 必须 记 住 它 的 用 途 是 什么 。 为 了 更 容易 记 住 元 组 的 用 途 ， 一 种 
笛 用 的 做 法 是 将 原子 作为 元 组 的 第 一 个 元 系 , 用 它 来 表示 元 组 是 什么 。 因 此 , 我 们 会 写成 {point， 
10，45]} 而 不 是 {10，45}， 这 就 使 程序 的 可 理解 性 大 大 增加 了 。 这 种 给 元 组 贴标签 的 方式 不 是 语 
言 所 要 求 的 ， 而 是 一 种 推荐 的 编程 风格 。 

元 组 还 可 以 般 丛 。 假 如 想 要 表示 某 人 的 一 些 悄 帝 ( 名 字 、 里 高 、 鞋 码 和 有 眼睛 颜色 )， 束 可 以 
像 下 面 这 人 么 与 : 

1> Person = {person, {name, joe}, {height, 1.82}, 


{footsize, 42}, {eyecolour, brown}}. 
{person, {name, joe}, {height, 1.82}, {footsize, 42}, {eyecolour, brown}} 


请 注意 我 们 是 如 何 将 原子 同时 用 于 标明 字段 和 ( 在 name 和 eyecotour 里 ) 作为 字段 值 的 。 


由 
































3.6.1 创建 元 组 


元 组 会 在 声明 它们 时 目 动 创建 ， 不 再 使 用 时 则 被 销毁 。 

Erlang 使 用 一 个 垃圾 收集 融 来 回收 所 有 未 使 用 的 内 存 ， 这 样 就 不 必 担 心 内 存 分 配 的 问题 了 。 

如 果 在 构建 新 元 组 时 用 到 变量 , 那么 新 的 元 组 会 共享 该 变量 所 引用 数据 结构 的 值 。 下 面 是 一 
个 例子 : 


2> F = {firstName, joe}. 

{firstName,]joe} 

3> L = {lastName, armstrong}. 
{lastName,armstrong} 

4> P = {person, F, L}. 

{person, {firstName,]Jjoe},{lastName,armstrong}} 

















如 采 试 图 用 未 定义 的 变量 创建 数据 结构 ， 就 会 得 到 一 个 错误 。 


5> {true, Q, 23, Costs}. 
+** ]: variable 'Q' is unbound ** 


这 何 的 意思 就 是 变量 4 未 定义 。 





3.6.2 ”提取 元 组 的 值 


之 前 说 过 ， 虽 然 = 看 上 去 像 是 赋值 请 句 ， 但 其 实 不 是 ， 它 是 一 个 模式 匹配 操作 符 。 你 可 能 好 
奇 我 们 为 什么 这 么 讲究 。 原 因 在 于 ， 模 式 匹 配 是 Erlang 的 根基 ， 在 众多 不 同 的 任务 中 都 会 用 到 。 
它 被 用 于 从 数据 结构 里 提取 值 ， 控制 函数 内 部 的 流程 ,在 并 行程 序 里 给 进程 发 消 肯 时 ,还 会 用 它 
选择 该 处 理 哪 些 消 息 。 

如 果 想 从 某 个 元 组 里 提取 一 些 值 ， 就 会 使 用 模式 匹配 操作 符 =。 

骨 回 头 看 看 表示 坐标 点 的 那个 元 组 。 

1> Point = {point, 10, 45}. 

{point, 10, 45}. 

假如 想 把 Point 里 的 字段 提取 到 变量 X 和 Y 里 ， 可 以 像 下 面 这 样 写 : 


2> {point, X, Y} = Point. 
{point, 10,45} 

3> XX. 

10 

4> YY. 

45 


在 命令 2 里 ，X 绑 定 了 10，Y 绑 定 了 45。 根 据 规 定 ， 表 达 式 Lhs = Rhs 的 值 是 Rhs， 因 此 shell 
打印 出 {fpoint,10,45}。 

如 你 所 见 ， 等 号 两 侧 的 元 组 必须 有 相同 数量 的 元 素 ， 而 且 两 侧 的 对 应 元 系 必 须 绑 定 为 相同 
的 值 。 

现在 假设 输入 了 这 样 的 语句 : 

5> {point, C, C} = Point. 

** exception error: no match of right hand side value {point,10,45} 

模式 {point，C，C} 与 {point，10，45} 不 匹配 ， 因 为 C 不 能 同时 是 10 和 45。 因 此 ， 这 次 模 
式 匹 配 失 败 ， 系 统 打印 出 了 错 谋 消 朋 。 

下 面 这 个 例子 里 , 模式 {point，C，C} 则 是 匹配 的 : 

6> Pointl1 = {point,25,25}. 

{point, 25, 25} 

7> {point, C, C} = Point1l. 

{boint, 25, 25} 


8> C., 
25 
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如 果 有 一 个 复杂 的 元 组 ,就 可 以 编写 一 个 与 该 元 组 形状 ( 结构 ) 相同 的 模式 ， 并 在 竺 提取 值 
的 位 置 加 入 未 绑 定 变量 来 提取 该 元 组 的 值 。 
为 了 说 明 这 一 点 ， 首 先 定义 一 个 包含 复杂 数据 结构 的 变量 Person。 


1> Person={person, {name, joe,armstrong}, {footsize,42}}. 
{person, {name,]joe,armstrong}, {footsize,42}} 


现在 将 编写 一 个 模式 来 提取 此 人 姓名 中 的 名 (first name )。 


2> {_,{_ ,Who, }, } = Person， 
{person, {name,joe,armstrong}, {footsize, 42}} 


最 后 来 看 看 Who 的 值 。 

3> Who. 

joe 

请 注意 ， 我 们 在 前 面 这 个 例子 中 将 作为 占 位 符 ， 用 于 表示 不 感 兴趣 的 那些 变量 。 符 号 被 
称 为 匿名 变量 。 与 正规 变量 不 同 ， 同 一 模式 里 的 多 个 不 必 绑 定 相同 的 值 。 























3.7 ”列表 
列表 (list ) 被 用 来 存放 任意 数量 的 事物 。 创 建 列表 的 方法 是 用 中 括号 把 列表 元 素 括 起 来 ， 
并 用 逗号 分 隔 它们 。 


假设 想 要 表示 一 个 图 形 。 如 果 假 定 此 图 形 由 三 角形 和 正方 形 组 成 ， 束 可 以 用 一 个 列表 来 表 
不 它 。 





1> Drawing = [{square,{10,10},10}, {triangle, {15,10},{25,10},{30,40}}, 

| 

这 个 图 形 列 表 里 的 每 一 个 元 素 都 是 固定 大 小 的 元 组 (例如 {square，Point，Side} 或 者 
{triangte，Point1，Point2，Point3} )， 但 这 个 图 形 本 喘 可 能 包含 任意 数量 的 事物 ， 因 此 用 
列表 来 表示 。 

列表 里 的 各 元 素 可 以 是 任何 类 型 ， 因 此 可 以 编写 下 面 这 个 例子 : 


2> [1+7,hello,2-2,{cost, apple, 30-20},3]. 
[8,hello,0, tcost,apple,10},3] 











3.7.1 专用 术语 


列表 的 第 一 个 元 系 被 称 为 列表 头 (head ), 假设 把 列表 头 去 掉 , 剩 下 的 就 被 称 为 列表 尾 (tail )。 

从 个 例子 ， 如 果 有 一 个 列表 [1,2,3,4,5] ， 那 么 列表 头 就 是 整数 1， 列 表 尾 则 是 列表 
[2,3,4,5] 。 请 注意 列表 头 可 以 是 任何 事物 ， 但 列表 尾 通 第 仍然 是 个 列表 。 

访问 列表 头 是 一 种 非 第 高 效 的 操作 ， 因 此 基本 上 所 有 的 列表 处理 函数 都 从 提取 列表 尖 开 始 ， 
然后 对 它 做 一 些 操作 ， 接 着 处 理 列表 尾 。 




















3.7.2 ”定义 列表 


如 有 末 T 是 一 个 列表 , 那么 [HIT] 也 是 一 个 列表 ,， 它 的 头 是 H， 尾 是 T。 坚 线 〈 | ) 把 列表 的 头 与 
尾 分 阳 开 。[] 是 一 个 空 列表 。 

LISP 程 序 员 请 注意 : [HIT] 是 一 个 CAR 为 H、CDR 为 T 的 CONS 单 元 。 此 语法 用 在 模式 里 会 解 
析出 CAR 和 CDR， 用 在 表达 式 里 则 会 构建 一 个 CONS 单 元 。 

无 论 何 时 ， 只 要 用 [...|T] 语 法 构建 一 个 列表 ， 就 应 该 确保 T 是 列表 。 如 有 果 它 是 ， 那 么 新 列 
表 就 是 “格式 正确 的 "。 如 采 T 不 是 列表 ， 那 么 新 列表 就 被 称 为 “不 正确 的 列表 ”"。 大 多 数 库 另 数 
假定 列表 有 正确 的 形式 ， 无 法 用 于 不 正确 的 列表 。 

可 以 给 T 的 开头 添加 不 止 一 个 元 素 ， 与 法 是 [E1,E2,..,En|T]。 

举 个 例子 ， 如 果 一 开始 定义 ThingsToBuy 如 下 : 


3> ThingsToBuy = [{apples,10},{pears,6},{milk,3}]. 
{apples,10}, {pears,6}, {milk,3}] 


那么 束 可 以 这 样 扩展 列表 : 


4> ThingsToBuyl = [{oranges,4}, {newspaper,1}|ThingsToBuy]. 
[{oranges,4}, {newspaper,1}, {apples, 10}, {pears,6}, {milk,3}] 








3.7.3 ”提取 列表 元 素 


和 其 他 情况 一 样 , 我 们 可 以 用 模式 匹配 操作 来 提取 某 个 列表 里 的 元 素 。 如果 有 一 个 非 空 列表 
L， 那 么 表达 式 [XIY] = L (X 和 Y 都 是 未 绑 定 变量 ) 会 提取 列表 头 作 为 X， 列 表 尾 作为 Y。 

当 我 们 在 商店 里 ， 手 上 拿 着 购物 单 ThingsToBuy1 时 ， 所 做 的 第 一 件 事 就 是 把 这 个 列表 拆 成 
头 和 尾 。 


5> [Buyl|ThingsToBuy2] = ThingsToBuy1. 
[{oranges,4}, {newspaper, 1}, {apples, 10}, {pears,6}, {milk,3}] 











操作 成 功 ， 绑 定 如 下 : Buyl = {oranges,4}, ThingsToBuy2 = [{newspaper,1}, 
{apples,10}，{pears,6}，{milk,3}]。 于 是 我 们 先 去 买 档 子 ( oranges )， 然 后 可 以 继续 拆 出 
下 一 对 商品 。 


6> [Buy2,Buy3|ThingsToBuy3] = ThingsToBuy2. 
[{newspaper, 1}, {apples, 10}, {pears,6}, {milk,3}] 


操作 成 功 后 Buy2 = {newspaper,1}，Buy3 = {apples,10} ， 而 ThingsToBuy3 = 
[{pears,6}, {milk,3}]。 


3.8 字符 串 


严格 来 说 ，Erlang 里 没有 字符 串 。 要 在 Erlang 里 表示 字符 串 ， 可 以 选择 一 个 由 整数 组 成 的 列 
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表 或 者 一 个 二 进 制 型 〈 话 细 请 参见 7.1 )。 当 字符 串 表 示 为 一 个 整数 列表 时 ， 列 表 里 的 每 个 元 素 
都 代表 了 一 个 Unicode 代 码 点 (codepoint )。 

可 以 用 字符 串 字 面 量 来 创建 这 样 一 个 列表 。 字 符 串 字面 量 ( string literal ) 其 实 就 是 用 双 引 号 
(") 围 起 来 的 一 串 字 符 。 比 如 ， 我 们 可 以 这 么 写 : 


1> Name = "HeLLo'"， 
"Hello" 


"Hello" 其 实 只 是 一 个 列表 的 人 简写， 这 个 列表 包含 了 代表 字符 串 里 各 个 字符 的 整数 学 符 代码。 























注意 ”在 一 些 编程 语言 里 , 字符 串 可 以 用 单 引 号 或 双 引 号 定 界 ,而 在 Erlang 里 , 必须 使 用 双 引 号 。 


当 shell 打 印 某 个 列表 的 值 时 ， 如 采 列 表 内 的 所 有 整数 都 代表 可 打印 字符 ,， 它 就 会 将 其 打印 成 
字符 串 字 面 量 。 否 则 ， 打 印 成 列表 记 法 (有 关 字 符 集 的 问题 请 参见 8.8 市 )。 

2> [1,2,3]. 

[1,2,3] 

3> [83,117,114,112,114,105,115,101]. 

"Surprise" 

4> [1,83,117,114,112,114,105,115,101]. 

[1,83,117,114,112,114,105,115,101]. 

在 表达 式 2 里 ， 列 表 [1,2,3] 在 打印 时 未 做 转换 。 这 是 因为 1、2 和 3 不 是 可 打印 字符 。 

在 表达 式 3 里 ， 列 表 里 的 所 有 项 目 都 是 可 打印 字符 ， 因 此 它 被 打印 成 字符 串 字 面 量 。 

表达 式 4 和 表达 式 3 差 不 多 ， 区 别 在 于 这 个 列表 以 1 开头 ， 而 1 不 是 可 打印 字符 。 因 此 ， 这 个 
列表 在 打印 时 未 做 转换 。 

不 需要 知道 代表 某 个 字符 的 是 哪 一 个 整数 ， 可 以 把 “美元 符号 语法 ”用 于 这 个 目的 。 举 个 例 
子 ，$a 实 际 上 就 是 代表 字符 a 的 整数 ， 以 此 类 推 。 

5> TI = $5. 

]15 

b> [1-32,$u, $r,$p, $r, $i,$s, $el]. 

"Surprise" 

用 列表 来 表示 字符 串 时 ， 它 里 面 的 各 个 整数 都 代表 Unicode 字 符 。 必 须 使 用 特殊 的 语法 才能 输 
和信 某 些 字符 ， 在 打印 列表 时 也 要 选择 正确 的 格式 惯例 。 通 过 下 面 这 个 例子 可 以 更 好 地 理解 这 一 点 。 

1>X= "a\x{22le}b". 

[97 ,8734 98 1] ， 

2> 1o:format("~ts~n'"，[X] ) 

acob 

在 第 1 行 里 , 我 们 创建 了 一 个 包含 三 个 整数 的 列表 。 第 一 个 整数 97 是 字符 a 的 ASCIT 和 Unicode 
编码 。\x{221e} 这 种 记 法 的 作用 是 输入 一 个 代表 Unicode 无 穷 大 字符 的 十 六 进 制 整数 ( 8734 )。 
最 后 ，98 是 字符 b 的 ASCIT 和 Unicode 编 码 。shell 用 列表 记 法 ( [97,8734,98] ) 将 它 打印 出 来 , 这 
是 因为 8734 不 是 一 个 可 打印 的 Latin1 字 符 编 码 。 在 第 2 行 里 ， 我 们 用 一 个 格式 化 IO 语句 打印 出 这 
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个 字符 串 ， 里 面 使 用 了 代表 无 穷 大 字符 的 正确 字符 图 案 。 

如 果 shell 将 某 个 整数 列表 打印 成 字符 串 ， 而 你 其 实 想 让 它 打印 成 一 列 整数 , 那 就 必须 使 用 格 
式 化 的 写 语句 ， 就 像 下 面 这 样 : 

1> X = [97,98,99]. 

"abc" 


2> ilo:format("~w~n",["abc"]). 
[97,98,99] 





3.9 ”模式 匹配 再 探 


为 了 完成 这 一 曹 ， 我 们 将 再 次 回 到 模式 匹配 上 来 。 

下 面 这 张 表 里 有 一 些 模式 与 单位 的 例子 ,模式 里 的 所 有 变量 部 假定 未 绑 定 过 。 单 位 (term ) 
就 是 指 任 何 一 种 Erlang 数 据 结 构 。 表 格 的 第 二 列 ( 标记 为 结果 ) 展示 了 模式 与 单位 是 否 匹 配 ， 以 
及 匹配 时 会 创建 哪些 变量 绑 定 。 请 仔细 阅读 这 些 例 子 ， 确 保 真 正 理解 了 它们 。 














模式 = 单元 结 来 
{X,abc} = {123,abc} 成 功 : X = 123 
{X,Y,Z} = {222,def, "cat"} 成 功 : X = 222, Y= def, Z = "cat" 
{X,Y} = {333,ghi, "cat"} 失败 : 元 组 的 形状 不 同 
X = true 成 功 : X = true 
{X,Y,X} = {{abc, 12},42, {abc, 12}} 成 功 : X = {abc,12}, Y = 42 
{X,Y,X} = {{abc, 12},42,true} 失败 : Xx 不 能 既是 {abc,12} 叉 是 true 
[HIT] = [1,2,3,4,5] 成 功 : H = 1, T = [2,3,4,5] 
[HIT] = "cat" 成 功 . H = 99, TT = "at" 
[A,B,CIT] = [a,b,c,d,e,f] 成 功 A = a, B=b,C=c,T= [d,e,f] 





如 果 对 其 中 任何 一 条 不 够 确定 ， 可 以 试 着 在 shell 里 输入 一 条 “模式 = 单位 ”表达 式 来 看 看 会 
发 生 什么 。 
这 里 有 一 个 例子 : 


1> {X, abc} = {123, abc}. 
{123,abc}. 
2> X, 


4> {X,Y,2} = {222,def,"cat"}. 
{222,def,"cat"}. 

5> X. 

222 

6> 站， 

def 


-大 
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注意 和牛 () 命 令 让 shell 忘 记 现 有 的 任何 绑 定 。 在 这 个 命令 之 后 ， 所 有 变量 都 会 变 成 未 绑 定 状态 ， 
因此 第 4 行 的 X 与 第 1 行 和 第 2 行 的 X 没 有 任何 关系 。 


现在 我 们 已 经 见 悉 了 基本 的 数据 类 型 , 以 及 一 次 性 赋值 和 模式 匹配 这 些 概 念 。 接 下 来 可 以 加 
快 节 委 ， 看 看 如 何 定 义 桂 块 和 函数 了 ， 这 就 是 第 4 章 的 主题 。 


3.10 ”练习 


(1) 快速 浏览 3.1.3 方 ， 然 后 测试 并 记忆 这 些 行 编辑 命令 。 

















些 结构 中 加 入 数据 或 从 中 取出 数据 。 





模块 与 函数 








模块 和 也 数 是 构建 顺序 与 并 行程 序 的 基本 单元 。 模 块 包 含 了 函数 ， 而 也 数 可 以 顺序 或 并 行 
运行 。 

本 章 建立 在 上 一 章 模 式 匹 配 概 念 的 基础 之 上 , 介绍 了 编写 代码 所 需 的 全 部 控制 语句 。 我 们 将 
讨论 高 阶 函数 ( 称 为 fun ) 及 如 何 用 它们 创建 你 自己 的 控制 抽象 。 男 外 ， 还 将 讨论 列表 推导 、 关 
卡 、 记 录 和 case 表 达 式 ， 并 展示 如 何 将 它们 用 在 代码 片段 里 。 

证 我 们 开始 吧 ! 


4.1 模块 是 存放 代码 的 地 方 


模块 是 Erlang 的 基本 代码 单元 。 模 块 保 存在 扩展 名 为 ,erL 的 文件 里 ,而且 必须 先 编译 才能 运 
行 模块 里 的 代码 。 编 译 后 的 模块 以 .beam 作 为 扩展 名 。 

编写 第 一 个 模块 之 前 , 先 来 回忆 一 下 模式 匹配 。 我 们 要 做 的 就 是 创建 一 对 数据 结构 ,分 别 代 
表 一 个 长 方形 和 一 个 正方 形 。 然 后 将 拆 开 这 些 数据 结构 ,提取 出 长 方形 和 正方 形 的 边 长 。 以 下 是 
具体 做 法 : 

1> Rectangle = {rectangle, 10, 5}. 

{rectangle, 10, 5S}. 

2> Square = {square, 3}. 

{square, 3} 

3> {rectangle, Width, Height} = Rectangle. 

{rectangle, 10,5} 

4> Width. 

10 

5> Height. 

5 

6> {square, Side} = Square. 

{square,3} 

7> Side. 

3 


我 们 在 第 1 行 和 第 2 行 里 创建 了 长 方形 ( Rectangle ) 和 正方 形 (Square )。 第 3 行 和 第 6 行 用 模 
式 匹 配 提 取出 长 方形 和 正方 形 中 的 字段 。 第 4、5$ 和 7 行 打 印 出 由 模式 匹配 表达 式 创建 的 变量 绑 定 。 
在 第 7 行 之 后 ，shell 里 的 变量 绑 定 是 Width = 10、Height = 5 和 Side = 3。 
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从 shell 里 的 模式 匹配 到 晒 数 里 的 模式 匹配 只 需要 很 小 的 一 步 。 让 我 们 从 一 个 名 为 area 的 呆 数 
开始 ， 它 将 计算 长 方形 和 正方 形 的 面积 。 我 们 会 把 它 放 和 一 个 名 为 geometry (几何 ) 的 模块 里 ， 
并 把 这 个 模块 保存 在 名 为 gqeometry .ertl 的 文件 里 。 整 个 模块 看 起 来 就 像 这 样 : 


geometry.erl 


-module(geometry). 
-export( [area/1]). 


area({rectangle, Width, Height}) -> Width * Height; 

area({square, Side}) -> Side * Side. 

文件 的 第 一 行 是 模块 声明 。 声 明 里 的 模块 名 必须 与 存放 该 模块 的 主 文件 名 相同 。 

第 二 行 是 导出 声明 。Name/N 这 种 记 法 是 指 一 个 带 有 N 个 参数 的 函数 Name ，N 被 称 为 限 数 的 元 
数 (arity )。export 的 参数 是 由 Name/N 项 目 组 成 的 一 个 列表 。 因 此 ，-export([area/1]) 的 意思 
是 带 有 一 个 参数 的 函数 area 可 以 在 此 模块 之 外 调用 。 

未 从 模块 里 导出 的 函数 只 能 在 模块 内 调用 ,已 导出 水 数 就 相当 于 面 癌 对象 编程 语言 (OOPL ) 
里 的 公共 方法 ,未 导出 函数 则 相当 于 OOPL 里 的 私有 方法 。 

area 上 因数 有 两 个 子 句 。 这 些 子 句 由 一 个 分 号 阳 开 ， 最 后 的 子 句 以 句号 加 空白 结束 。 每 条 子 
句 都 有 一 个 头 部 和 一 个 主体 ， 两 者 用 向 头 〈 -> ) 分 隔 。 头 部 包含 一 个 函数 名 ， 后 接 零 个 或 更 多 个 
模式 ， 主 体 则 包含 一 列表 达 式 (8.13 市 对 表达 式 进 行 了 定义 )， 它 们 会 在 头 部 里 的 模式 与 调用 参 
数 成 功 匹 配 时 执行 。 这 些 子 句 会 根据 它们 在 函数 定义 里 出 现 的 顺序 进行 匹配 。 

注意 之 前 用 于 shell 示 例 里 的 模式 是 如 何 成 为 area 函 数 定 义 的 一 部 分 的 。 每 个 模式 都 精确 对 应 
一 条 子 句 。area 国 数 的 第 一 条 子 句 : 


area({rectangle, Width, Height}) -> Width * Height; 


告诉 我 们 如 何 计 算 长 方形 的 面积 。 执 行 消 数 geometry:area({rectangle，10，5}) 时 ， 
area/1 的 第 一 个 子 名 匹配 了 以 下 绑 定 : Width = 10 和 Height = 5。 匹 配 之 后 ， 箭 头 -> 后 面 的 
代码 会 被 执行 ， 也 就 是 Width * Height， 即 10*5 等 于 50。 请 注意 此 函数 没有 显 式 的 返回 语句 。 
它 的 返回 值 就 是 子 句 主体 里 最 后 一 条 表达 式 的 值 。 

现在 编 详 这 个 模块 ， 然 后 运行 它 。 

1> c(geometry). 

{ok,geometry} 

2> geometry:area({rectangle, 10, 5}). 

D0 


3> geometry:area({square, 3}). 
9 


在 第 1 行 给 出 了 命令 c(geometry), 它 的 作用 是 编译 geometry.erl 文 件 里 的 代码 ,编译 带 返 
回 了 {ok,geometry}， 意 思 是 编译 成 功 ， 而 有 晶 geometry 模 块 已 被 编译 和 加 载 。 编 译 器 会 在 当前 
目录 创建 一 个 名 为 geometry .beam 的 目标 代码 模块 。 在 第 2 行 和 第 3 行 调用 了 geometry 模 块 里 的 
负数 。 请 注意 ， 需 要 给 函数 名 附 上 模块 名 ， 这 样 才 能 准确 标明 想 调 用 的 是 哪个 吨 数 。 
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4.1.1 弟 见 错误 


: 之 前 用 到 的 c(geometry) .等 命令 只 能 在 shell 里 工作 ， 不 能 放 和 人 模块。 有 些 读者 错误 
We 码 片 段 输 入 到 shell 中 。 它 们 不 是 有 效 的 shell 人 命令， 如 果 试 图 这 样 做 会 得 到 
一 些 非常 奇怪 的 错误 消息 。 所 以 ， 别 这 么 干 。 
如 果 你 碰巧 选择 了 与 系统 模块 相 冲 突 的 模块 名 , 那么 编译 模块 时 会 得 到 一 条 奇怪 的 消息 , 说 
能 加 载 位 于 固定 目录 (sticky directory ) 的 模块 。 只 需 重 命名 那个 模块 ， 然 后 删除 允 编译 模块 时 
了 .beam 文 件 就 可 以 了 。 


4.1.2 目录 和 代码 路 径 


如 果 你 下 载 了 本 书 的 代码 示例 或 者 想 编 写 自 己 的 示例 , 请 务必 确保 在 shell 里 运行 编译 需 时 位 
于 正确 的 目录 ， 这 样 系统 才能 找到 你 的 文件 。 

Erlang shell 有 许多 内 建 命令 可 供 查 看 和 修改 当前 的 工作 目录 。 

口 pwd() 打 印 当前 工作 目录 。 

D 1Ls() 列 出 当前 工作 目录 里 所 有 的 文件 名 。 

D cd(Dir) 修 改 当 前 工作 目录 至 Dir。 


























4.1.3 给 代码 ;条 加 疯 试 


在 这 个 阶段 ,可 以 给 模块 添加 一 些 简 单 的 测试 。 把 模块 重 命名 为 geometry1.erl, 然后 添加 
一 些 测 试 代码 。 


geometry1.erl 


-module (geometry1). 
-export([test/0, area/1]). 


12 area({rectangle, 3, 4}), 
144 = area({square, 12}), 
tests worked. 


test() -> 


area({rectangle, Width, Height}) -> Width * Height; 
area({square, Side}) -> Side * Side. 


1> c(geometryl). 
{ok,geometryl} 

2> geometryl:test!(). 
tests worked 


12 = area({rectangle，3，4}) 这 行 代 码 是 一 项 测试 。 如 果 area({rectangle，3，4}) 
没有 返回 12， 模式 匹配 就 会 失败， 我 们 会 得 到 一 条 错误 消息 。 执 行 geometry1l:test() 并 看 到 绪 
果 是 tests worked 时 ， 就 可 以 确定 test/0 主 体 里 的 所 有 测试 都 成 功 通过 了 ， 
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无 需 任 何 额外 的 工具 就 能 轻松 添加 测试 并 实施 测试 驱动 的 开发 ,所 需 的 仅仅 是 模式 匹配 和 =。 
虽然 这 对 随手 测试 来 说 足够 了 , 但 生产 用 代码 最 好 还 是 使 用 一 父 全 功能 的 测试 框架 ， 比 如 通用 或 
单元 测试 框架 。 详 情 请 参阅 Erlang 文 档 * 的 测试 部 分 。 














4.1.4 扩展 程序 
现在 假设 想 要 扩展 这 个 程序 ， 给 几何 对 象 添 加 一 个 圆 。 可 以 这 么 写 : 


area({rectangle, Width, Height}) -> Width * Height; 


area({square, Side}) -> Side * Side,; 

area({circle, Radius}) -> 3.14159 * Radius * Radius. 
或 者 这 人 么 写 : 

area({rectangle, Width, Height}) -> Width * Height; 
area({circle, Radius}) -> 3.14159 * Radius * Radius,; 
area({square, Side}) -> Side * Side. 








请 注意 ， 这 个 例子 里 的 子 句 顺序 无 关 紧 要 。 无 论 子 句 如 何 排列 ,程序 都 是 一 个 意思 ， 因 为 子 
句 里 的 各 个 模式 是 互 斥 的 。 这 让 编写 和 扩展 程序 变 得 非常 简单 : 只 要 添加 更 多 的 模式 就 行 了 。 不 
过 一 般 来 说 , 子 句 的 顺序 还 是 很 重要 的 。 当 某 个 冰 数 执行 时 ,和子 句 与 调用 参数 进行 模式 匹配 的 顺 
序 就 是 它们 在 文件 里 出 现 的 顺序 。 
在 进一步 讨论 之 前 ， 你 应 当 注 意 area 函 数 编写 方式 的 下 列 细节 。 
口 area 随 数 包含 了 多 个 不 同 的 子 句 。 当 我 们 调用 这 个 函数 时 ,会 从 第 一 个 与 调用 参数 相 匹 
配 的 子 句 开始 执行 。 

口 我 们 的 子 数 并 不 处 理 模 式 匹 配 失 败 的 情形 ， 程 序 会 以 一 个 运行 时 错误 结束 。 这 是 有 意 而 
为 的 ， 是 在 Erlang 里 编程 的 方式 。 

在 许多 编程 语言 ( 例如 C ) 里 ， 一 个 函数 只 有 一 个 人 口 点 。 如 有 是 用 C 编 写 的 程序 ， 代 码 可 




















enum ShapeType { Rectangle, Circle, Square }; 


struct Shape 1{ 
enum ShapeType kind,; 


union 1{ 
struct { int width, height; } rectangleData; 
struct { Int radius; } circleData; 
struct { int side;} squareData ; 


} shapeData ; 


GD http:/www.erlang.org/doc 
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double area(struct Shape* s) { 
if( s->kind == Rectangle ) 1{ 
int width, ht; 
width = s->shapeData,rectangleData ,width,; 
ht = Ss->shapeData.rectangleData.height; 
return width * ht; 
} else if ( s->kind == Circle ) 二 


这 段 C 代 码 基 本 上 就 是 对 函数 的 参数 执行 模式 匹配 操作 ， 但 程序 员 必须 编写 模式 匹配 的 代 
码 ， 并 确保 它 是 正确 的 。 

而 在 对 应 的 Erlang 代 码 里 ， 我 们 只 需要 编写 模式 ，Erlang 编 译 器 就 会 生成 最 佳 的 模式 匹配 代 4 
码 ， 用 它 来 选择 正确 的 程序 入 口 点 。 

下 面 展 示 了 对 应 的 Java 代 码 : 


abstract class Shape 1{ 
abstract double areafl) ; 








} 


class Circle extends Shape 1{ 
final double radius; 
Circle(double radius) { this.radius = radius; } 
double area() { return Math.PI * radius*radius; 
} 


class Rectangle extends Shape 1{ 
final double ht ; 
final double width; 
Rectangle(double width, double height) 1{ 
this.ht = height, 
this.width = width 
} 


double area() { return width * ht; } 
} 


class Square extends Shape { 
final double side, 
Square(double side) 1 
this.side = Side; 


} 


double area() { return side * side; } 


, 


如 果 对 比 Erlang 和 Java 的 代码 ,你 会 看 到 Java 程 序 里 的 area 代 码 分 为 三 处 ,而 在 Erlang 程 序 里 ， 
所 有 的 area 代 码 都 在 同一 个 地 方 。 
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4.1.5 分 号 放 哪 里 


离开 geometry 示 例 之 前 ， 我 们 最 后 再 看 一 下 它 的 代码 ， 这 一 次 看 的 是 标点 符号 。 请 仔细 观 
察 去 号、 分 号 和 名 所在 代码 里 的 位 置 。 














geometry.erl 


-module(geometry). 
-export( [area/1]). 


area({rectangle, Width, Height}) -> Width * Height; 
area({square, Side}) -> Side * Side. 
你 会 看 到 以 下 内 容 。 
口 适 号 (，) 分 隔 函 数 调用 、 数 据 构造 和 模式 中 的 参数 。 
口 分 号 (; ) 分 隅 子 句 。 我 们 能 在 很 多 地 方 看 到 了 于 名， 例如 函数 定义 ， 以 及 case、if、 
try, ,catch 和 receive 表 达 式 。 
口 句号 (, ) (后 接 空白 ) 分 隔 函 数 整 体 ， 以 及 shell 里 的 表达 式 。 
有 一 种 简单 的 方法 可 以 记 住 这 些 : 想 想 英语 。 句号 分 阳 句 了 于, 分 号 分 阳 子 名 ,逗号 则 分 隅 下 
级 子 句 。 喜 号 象征 短程 ， 分 号 象征 中 程 ， 句 号 则 象征 长 程 。 

每 当 我 们 看 见 一 组 组 后 接 表达 式 的 模式 ,就 会 看 到 它们 用 分 扎 作 为 间 隅 符 。 这 里 有 一 个 例子 : 
case f(...) of 

patternl -> 

Expressions1,; 


Pattern2 -> 
Expressions2, 




















Lastpattern -> 
LastExpression 
end 


请 注意 ， 最 后 的 表达 式 〈 即 关键 字 end 之 前 的 那 条 ) 没有 分 号 。 
理论 说 得 够 多 了 ， 让 我 们 继续 来 看 代码 ， 过 些 时 候 再 回 到 控制 结构 上 来 。 


4.2 ”继续 购物 
在 3.7.2 节 里 ， 有 一 个 像 这 样 的 购物 列表 : 


[{oranges,4}, {newspaper,1}, {apples,10}, {pears,6}, {milk,3}] 


现在 假设 我 们 想 要 知 近 购物 花 了 多 少 钱 。 要 计算 它 ,需要 知道 购物 列表 里 每 一 项 的 价格 。 假 
设 此 信息 将 在 一 个 名 为 shop 的 模块 中 计算 ， 它 的 定义 如 下 : 
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shop.erl 


-module (shop). 
-export([cost/1]). 


cost (oranges) -> 5) 
cost(newspaper) -> 8; 
cost(apples) -> 2; 
cost (pears) -> 9; 
cost (milk) -> 7， 





国 数 cost/1 由 5$ 个 子 甸 组成。 每 个 子 句 的 头 部 都 包含 一 个 模式 ( 在 这 个 案例 里 只 是 一 个 非常 
简单 的 原子 )。 当 执行 shop:cost(X) 时 ， 系 统 会 尝试 将 X 与 各 子 句 中 的 模式 相 匹 配 。 如 采 发 现 了 
匹配 ， 就 会 执行 -> 右 侧 的 代码 。 

来 测试 一 下 。 我 们 将 在 Erlang shell 里 编译 并 运行 这 个 程序 。 

1> c(shop). 

{ok, shop} 

2> shop:cost(apples). 

2 

3> shop:cost(oranges). 

5 

4> shop:cost(socks). 

** exception error: no function clause matching shop:cost(socks) 

(shop.erl, line 4) 


我 们 在 第 1 行 编译 了 shop.erl 文 件 里 的 模块 。 在 第 2 行 和 第 3 行 ， 查 询 了 apples 和 oranges 
的 价格 ( 结果 中 的 2 和 5 是 单价 )。 在 第 4 行 查询 了 socks (袜子 ) 的 价格 , 但 因为 没有 子 句 与 其 匹 
配 ， 所 以 得 到 了 一 个 模式 匹配 错误 ， 系 统 打印 出 一 条 包含 文件 名 和 出 错 行 号 的 错误 消息 。 

再 回 到 购物 列表 。 假 设 有 一 个 像 这 样 的 购物 列表 : 


1> Buy = [{oranges,4}, {newspaper,1}, {apples,10}, {pears,6}, {milk,3}]. 
[{oranges,4}, {newspaper, 1}, {apples, 10}, {pears,6},{milk,3}] 


而 我 们 想 要 计算 列表 里 所 有 项 目的 总 价值 。 一 种 做 法 是 定义 一 个 shop1:total/1 员 数 如 下 : 

















shop1.erl 


-modulet{shopl)., 
-export{([total/1i]). 


total({{[{what, N}|T]) -> shop:cost(What) * N + total(T); 
total({]) -> 0, 


拿 它 试验 一 下 : 


2> Cc(shopl). 

{ok, shopl} 

3> shopl:total(|[]). 
0 
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这 里 返回 9 是 因为 total/1 的 第 二 个 子 句 是 total([]) -> 0。 
下 面 是 一 条 更 复杂 的 查询 : 


4> shopl:total([{milk,3}]). 
21 


这 里 的 工作 方式 如 下 。shopl:totatL([{fmitLk,3}]) 与 下 面 这 个 子 句 相 匹 配 ， 从 而 绑 定 了 
What = miLk、N = 3 以 及 T = []: 





total([{what,N}|T]) -> shop:cost(What) * N + total(T); 

接 下 来 ， 洱 数 的 主体 代码 被 执 行 ， 所 以 要 执行 的 表达 式 是 : 

shop:cost (milk) * 3 + total([]); 

shop:cost(miLk) 等 于 7，totaL([]) 等 于 0， 因 此 最 终 的 返回 值 是 21。 
还 可 以 用 更 复杂 的 参数 来 测试 它 。 


5> shopl:total([{pears,6}, {milk,3}]). 
75 


同样 ， 第 5 行 与 total/1 的 第 一 个 子 句 相 匹 配 ， 绑 定 了 What = pears、N = 6 以 及 T = 
[{mitlk,3}]。 

total([{what,N}|T]) -> shop:cost(What) * N + total(T); 

变量 What 、N 和 T 在 子 句 主体 中 被 蔡 换 ,执行 的 是 shop:cost(pears) *6+total([{milk, 
3}] ) ， 人 简化 后 就 是 0 * 6 + total([{mitlk,3}])。 

而 之 前 已 经 算出 total ([{mitk,3}]) 等 于 21， 因 此 最 终 的 结果 是 9 * 6 + 21 = 75。 

了 最 后 : 








6> 5shopl:totaL(Buy ) . 
123 

















况 分 析 。 可 能 的 情况 有 两 种 : L 要 么 是 一 个 非 空 列表 ， 要 么 是 一 个 空 列 表 。 我 们 为 每 一 种 可 能 的 
情况 编写 一 个 子 句 ， 就 像 这 样 : 
total([Head|Tail]) -> 
some function of(Head) + total (Tail); 


total([]) -> 
0 


在 这 个 案例 中 ，Head 是 模式 {What,N}。 当 了 于 名 1 匹配 了 一 个 非 空 列表 ， 就 会 从 中 取出 列表 头 ， 
用 人 它 做 一 些 事 ,然后 调用 目 号 继续 处 理 列表 尾 。 当 列表 颖 减 至 空 列表 ([] ) 时 ， 束 会 匹配 于 名 2。 

totaL/1L 函 数 实 际 上 做 了 两 件 事 。 它 首先 查询 列表 里 每 个 元 素 的 价格 ， 然 后 将 它们 乘 以 购买 
数量 后 的 值 加 在 一 起 。 可 以 换 一 种 方式 重 写 total, 将 查找 各 个 项 目的 值 与 累加 这 些 值 区 分 开 来 。 
这 样 代码 丈 会 更 加 清晰 ， 也 更 易于 理解 。 要 做 到 这 一 点 ,我们 将 编写 两 个 处 理 列表 的 小 函数 ,分 
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别名 为 sum 和 map。 要 编写 map， 必 须 先 介绍 fun 的 概念 。 在 此 之 后 ， 将 编写 一 个 改进 版 的 total， 
你 可 以 在 4.4 节 的 shop2.ert 模 块 里 找到 它 。 


4.3 fun: 基本 的 抽象 单元 


Erlang 是 一 种 水 数 式 编程 语言 。 此 外 ， 气 数 式 编程 语言 还 表示 也 数 可 以 被 用 作 其 他 函数 的 参 
数 ， 也 可 以 返回 国 数 。 操 作 其 他 函数 的 函数 被 称 为 高 阶 函 数 〈《higher-order function )， 而 在 Erlang 
中 用 于 代表 函数 的 数据 类 型 被 称 为 fan。 
高 阶 函 数 是 函数 式 编程 语言 的 精髓 六 数 式 程序 不 仅 可 以 操作 稼 规 的 数据 结构 ,还 可 以 操 
作 改 变数 据 的 轴 数 。 一 旦 你 学 会 如 何 使 用 它们 ， 就 会 爱 上 它们 。 在 后 面 会 看 到 更 多 的 高 阶 冰 数 。 
可 以 通过 下 列 方式 使 用 fun。 
口 对 列表 里 的 每 一 个 元 素 执行 相同 的 操作 。 在 这 个 案例 里 ， 将 fan 作 为 参数 传递 给 
Lists:map/2 和 Lists:fiLter/2 等 国 数 。fon 的 这 种 用 法 是 极其 普 抽 的。 
口 创建 自己 的 控制 抽象 。 这 一 技巧 极其 有 用 。 例 如 ，Erlang 没 有 for 循 环 ， 但 我 们 可 以 轻松 
创建 自己 的 for 循 环 。 创 建 控制 抽象 的 优点 是 可 以 让 它们 精确 实现 我 们 想 要 的 做 法 ， 而 不 
是 依赖 一 组 预定 义 的 控制 抽象 ， 因 为 它们 的 行为 可 能 不 完全 是 我 们 想 要 的 。 
口 实现 可 重 人 解析 代码 (reentrant parsing code )、 解 析 组 合 需 〈parser combinator ) 或 惰性 求 
值 锅 (lazy evaluator ) 等 事物 。 在 这 个 案例 里 ， 我们 编写 返回 fun 的 函数 。 这 种 技术 很 强 
大 ， 但 可 能 会 导致 程序 难以 调试 。 
funs 是 “匿名 的 ” 哺 数 。 这 样 称呼 它们 是 因为 它们 没有 名 字 。 你 可 能 会 看 到 其 他 编程 语言 
水 它们 为 lambda 抽 梨 。 下 面 开 始 试 验 ， 首 先 将 定义 一 个 fun 并 将 它 指 铂 给 一 个 变量 。 
1> Double = fun(X) -> 2*X end. 
#Fun<erl eval.6.56006484> 
定义 一 个 fun 后 ，Erlang shell 打 印 出 #Fun<..., >， 里面 的 ., .是 一 些 十 怪 的 数字 。 现 在 无 需 担 
心 它们 。 
我 们 只 能 对 fon 做 一 件 事 ， 那 就 是 给 它 应 用 一 个 参数 ， 就 像 这 样 : 
2> Double(2). 
4 


fun 可 以 有 任意 数量 的 参数 。 可 以 编写 一 个 咀 数 来 计算 下 角 三 角形 的 和 斜 边 ， 束 像 这 样 : 


3> Hypot = fun(X, Y) -> math:sqrt(X*X + Y*Y) end. 
#Fun<erl eval.12.115169474> 

4> Hypot(3,4). 

5.0 


如 采 参 数 的 数量 不 正确 ， 将 会 得 到 一 个 错误 。 


5> Hypot(3). 
** exception error: interpreted function with arity 2 called with one argument 
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这 段 错 误 消 息 说 明 Hypot 接 受 两 个 参数 ,但 我 们 只 提供 了 一 个 。 之 前 说 过 , 元 数 是 一 个 阴 数 
接受 的 参数 数量 。 
fun 可 以 有 多 个 不 同 的 子 句 。 这 里 有 一 个 转换 华氏 与 摄氏 温度 的 函数 : 


6> TempConvert = fun({c,C}) -> {f, 32 + C*9/5}; 
6> ({f,F}) -> {fc, (F-32)*5/9} 
6> end. 

#Fun<erl eval.6.56006484> 

/> TempConvert({c,100}). 

{f,212.0} 

23> TempConvert({f,212}). 

{c,100.0} 

9> TempConvertt({c ,9}+) . 

{f,32.0} 





注意 ”第 6 行 的 表达 式 占 据 了 多 行 。 输入 这 个 表达 式 时 ， 每 输入 一 个 新 行 ，shell 就 会 重复 6> 这 个 
Oo 


4.3.1 以 fun 作 为 参数 的 函数 


标准 库 里 的 Lists 模 块 导 出 了 一 些 以 fun 作 为 参数 的 函数 ,它们 之 中 最 有 用 的 是 lists:map(F 
L)。 这 个 函数 返回 的 是 一 个 列表 ， 它 通过 给 列表 L 里 的 各 个 元 素 应 用 fun F 生 成 。 


10> L = [1,2,3,4]. 

[1,2,3,4] 

11> lists:map(fun(X) -> 2*X end, L). 
[2,4,6,8] 


另 一 个 有 用 的 图 数 是 Lists:fiLter(P，L)， 它 返回 一 个 新 的 列表 ， 内 含 L 中 所 有 符合 条 件 
的 元 对 (多 os E) 为 true )。 
定义 一 个 果 数 Even(X) ， 如 果 X 是 偶数 就 返回 true。 


12> Even = fun(X) -> (X rem 2) =:= 0 end . 
#Fun<erl eval.6.56006484> 


这 里 的 Xx rem 2 会 计算 出 X 除 以 2 后 的 余数 ，=:= 用 来 测试 是 否 相 等 。 现 在 可 以 测试 Even， 然 
后 将 它 用 作 map 和 fiLter 的 参数 了 。 


13> Even(8). 

true 

14> Even(7). 

false 

15> lists:map(Even, [1,2,3,4,5,6,8]). 
[false,true,false,true,false,true,truel] 
16> lists:filter(Even, [1,2,3,4,5,6,8]). 
[2,4,6,8] 
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map 和 filter 等 限 数 能 在 一 次 调用 里 对 整个 列表 执行 某 种 操作 , 我 们 把 它们 称 为 一 次 一 列表 
( list-at-a-time ) 式 操 作 。 使 用 一 次 一 列表 式 操 作 让 程序 变 得 更 小 ， 而 且 易 于 理解 。 之 所 以 易于 理 
解 是 因为 我 们 可 以 把 对 整个 列表 的 每 一 次 操作 看 作 程序 的 单个 概念 性 步 又 。 否则 , 丈 必 须 将 对 列 
表 元 系 的 每 一 次 操作 视 为 程序 的 单独 步 又 了 














4.3.2 ”返回 fun 的 函数 


也 数 不 仅 可 以 使 用 fun 作 为 参数 ( 例如 map 和 filter )， 还 可 以 返回 fun。 
这 里 有 一 个 例子 。 假 设 我 有 一 个 包含 某 种 事物 的 列表 ， 比 如 说 水 果 : 


1> Fruit = [apple,pear,orangel]. 
[apple, pear, orangel] 


现在 我 可 以 宇 义 一 个 MakeTest (L) 国 数 ， 将 事物 列表 (L ) 转变 成 一 个 测试 函数 ， 用 来 检查 
它 的 参数 是 否 在 列表 L 中 。 


2> MakeTest = fun(L) -> (fun(X) -> lists:member(X, L) end) end . 
#Fun<erl eval.6.56006484> 

3> IsFruit = MakeTest(Fruit). 

#FunNn<erl eval.6.56006484> 














如 果 X 是 列表 L 中 的 成 员 ，lists:member(X, L) 束 返回 true， 否 则 返回 false。 构建 完 测试 
旺 数 之 后 ， 我 们 可 以 来 试 试 它 。 


4> TsFruit(pear), 
true 

5> TsFruit(apple). 
true 

6> IsFruit(dog). 
false 


也 可 以 把 它 用 作 tists:filter/2 的 参数 。 


7> lists:filter(IsFruit, [dog,orange,cat,apple,bear]). 
[orange,applel 


这 种 用 fun 来 返回 fun 的 写法 可 能 需要 一 些 时 间 才 能 习惯 ， 所 以 先 来 分 解 一 下 这 种 写法 ,让 其 
中 的 过 程 更 清楚 一 些 。 一 个 返回 “ 正 第 ” 值 的 函数 是 这 样 的 : 

了 > Double = fun(X) -> (2* XxX ) end. 

#Fun<erl eval.6.56006484> 

2> Double(5). 

10 

括号 里 的 代码 (也 就 是 2 * X) 很 明显 就 是 此 也 数 的 “返回 值 ”"。 现 在 试 着 把 一 个 fun 放 到 括 
号 内 。 


记 住 ， 括 写 里 的 东西 就 是 返回 值 。 
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3> Mult = fun(Times) -> ( fun(X) -> X * Times end ) end . 

#Fun<erl eval.6.56006484> 

括号 里 的 fun 是 fun(X) -> X * Times end， 它 只 是 一 个 关于 X 的 匈 数 。Times 是 “外 部 ”fun 
的 参数 。 

Mult(3) 执 行 后 返回 fun(X) -> XY * 3 end， 即 内 部 fun 的 主体 (Times 被 替换 为 3 )。 现 在 
我 们 可 以 测试 它 了 。 

4> TripLe = MuLt(3) ， 

#Fun<erl _ eval ,6.56006484> 

5> TripLe(5) ， 

15 

所 以 ，Mult 是 通用 化 的 Double。 它 不 计算 值 ， 而 是 返回 一 个 函数 ， 调 用 该 函数 时 会 计算 所 
需 的 值 。 


4.3.3 ”定义 你 目 己 的 控制 抽象 


到 目前 为 止 , 还 没有 看 到 任何 的 if 语 句 、switch 语 句 、for 语 句 或 while 语 句 ， 然 而 这 似乎 
没什么 问题 。 所 有 的 一 切 都 是 用 模式 匹配 和 高 阶 函 数 编写 的 。 

如 果 想 要 额外 的 控制 结构 ， 可 以 自己 创建 。 这 里 有 个 例子 ，Erlang 没 有 for 和 循环， 所 以 我 们 
来 创建 一 个 : 











lib_misc.erl 


for(Max, Max, F) -> [F(Max)]; 
for(I, Max, F) -> [F(T)|for(I+1l, Max, F)]. 


举 个 例子 ， 执 行 for(1,10,F) 会 创建 列表 [F(1)，F(2)，...，F(10)]。 
现在 已 经 有 了 一 个 稍 单 的 for 循 环 。 我 们 可 以 用 它 生成 一 个 从 1 到 10 的 整 效 列表 。 


1> Lib misc:for(1,10,fun(I) -> TI end)， 
[1,2,3,4,5,6,7,8,9,10] 


或 者 ， 也 可 以 计算 从 1 到 10 的 整数 平方 。 


2> Lib misc:for(1,19,fun(I) -> I*I end). 
[1,4,9,16,25,36,49,64,81,100] 


等 你 有 了 经 验 , 就 会 发 现 创 建 自 己 的 控制 结构 能 大 大 降低 程序 的 大 小 , 有 时 还 能 让 它们 更 加 
清晰 。 这 是 因为 你 能 精确 地 创建 出 解决 问题 所 需要 的 控制 结构 ,同时 还 不 受 编程 语言 目 带 的 少量 
固定 控制 结构 所 限 。 


4.4 简单 列表 处 理 


介绍 完 fan 之 后 ， 可 以 继续 编写 Sum 和 map 了。 我 们 需要 用 它们 来 实现 改进 版 的 totaL ( 相信 
你 还 没有 忘记 它 )。 
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先 从 sum 开 始 ， 它 计算 某 个 列表 里 所 有 元 素 的 总 和 。”™ 


mylists.erl 

@ sum([H|IT]) -> H + sum(T); 

@ sun([]) -> 9， 

注意 , 这 两 个 sum 子 句 的 顺序 并 不 重要 。 因 为 子 句 1 匹配 一 个 非 空 列 表 , 而 子 句 2 匹配 空 列表 ， 
这 两 种 情况 是 互 斥 的 。 可 以 像 下 面 这样 测 试 sum: 

1> c(mylists). %% <-- Last time I do this 

{ok, mylists} 

2»> LL = [1,3,10]; 

[1,3,10] 

3> mylists:sum(L). 

14 


第 1 行 编译 了 了 mylists 模块 。 从 现在 起 ， 我 会 不 时 地 省 略 编 译 模 块 的 命令 ， 因 此 你 必须 记得 
目 己 做 这 一 步 。 这 一 点 也 不 难 理解 。 下 面 来 跟踪 一 下 执行 过 程 。 

(1) sum([1,3,10]) 

(2) sum([1,3,10]) = 1 + sum([3,10]) (通过 @ ) 

(3)=1+3+ sum([10]) (通过 @ ) 

()=1+3+10+sum([]) (通过 @ ) 

(5)=1+3+10+0 (通过 @ ) 

(6) = 14 

最 后 ， 来 看 看 前 面 曾 遇 到 的 map/2。 它 的 定义 如 下 : 











mylists.erl 

@ nap(_, []) -> []; 

@ map(F, [HIT]) -> [F(H)|map(F, T)]. 

@ 子 句 1 说 明 如 何 处 理 空 列表 。 让 任何 函数 映射 一 个 空 列表 里 的 元 素 ( 一 个 也 没有 ! ) 只 会 
得 到 一 个 空 列表 。 

人 @ 子 句 2 规定 了 如 何 处 理 融 有 头 H 和 尾 T 的 列表 。 这 很 简单 ， 只 要 构建 一 个 头 为 FUH) 、 尾 为 
map(F,， 丁 ) 的 新 列表 束 可 以 了 。 


注意 map/2 的 定义 是 直接 从 标准 库 的 Lists 模 块 复制 到 mylists 里 的 。 你 可 以 对 mylists.erl 里 
的 代码 做 任何 想 做 的 事 , 但 在 任何 情况 下 都 不 要 试图 制作 自己 的 Lists 模 块 一 一 在 Lists 里 犯 
的 任何 错误 都 可 能 会 给 系统 造成 严重 损坏 。 





可 以 用 map 来 运行 一 些 函 数 ， 得 到 菏 个 列表 里 所 有 元 系 的 双 信 或 平方 ， 束 像 下 面 这 样 : 


中 代码 片段 中 的 @@ 在 下 面 会 用 到 ， 下 同 。 一 一 译 者 注 


44 第 4 章 ， 模块 与 函数 


17>L= [1,2,3,4,5]. 

[1,2,3,4,5] 

2> mylists:map(fun(X) -> 2*X end, L). 
[2,4,6,8,10] 

3> mylists:map(fun(X) -> X*X end, L). 
[1,4,9,16,25] 


稍 后 会 展示 map 的 进一步 简化 版 ， 用 列表 锥 叶 编 写 。26.3 玉 会 展示 如 何 并 行 计算 所 有 的 映射 
元 素 (这 样 在 多 核 计算 机 上 就 会 加 速 我 们 的 程序 )， 不 过 这 个 话题 太 过 超前 了 。 现 在 我 们 已 经 了 
解 了 sum 和 map， 可 以 用 这 两 个 函数 重 写 totaL 了 : 








shop2.erl 


-module(shop2). 
-export( [total/1]). 
-import(lists, [map/2, sum/1]1). 


total(L) -> 
sum(map (fun({What, N}) -> shop:cost(What) * N end, L)). 


可 以 通过 观察 其 中 的 步 又 来 了 解 这 个 图 数 的 工作 方式 。 


1> Buy = [{oranges,4}, {newspaper,1},{apples,10}, {pears,6}, {milk,3}]. 
[{oranges,4}, {newspaper,1}, {apples,10}, {pears,6}, {milk,3}] 

2> Ll=lists:map(fun({What,N}) -> shop:cost(What) * N end, Buy). 
[20,8,20,54,21] 

3> lists:sum(L1). 

123 


我 是 如 何 编写 程序 的 

编写 程序 时 ， 我 的 做 法 是 “编写 一 点 ”然后 “测试 一 点 ”。 我 从 一 个 包含 少量 函数 的 小 模 
块 开 始 ,， 先 编译 它 ， 然后 在 Shell 里 用 一 些 命令 测试 它 。 妆 我 觉得 满意 后 ,就 会 再 编写 一 些 函 数 ， 
编译 它们 ， 测 试 它们 ， 以 此 类 推 。 

通常 ， 我 并 不 完全 确定 程序 需要 什么 样 的 数据 结构 ， 通 过 测试 那些 样本 代码 ， 我 就 能 看 
出 所 选 的 数据 结构 是 否 合适 。 

0 nn 
题 时 才 发 现 犯 了 大 错 。 最 重要 的 是 ,这 样 做 很 有 超 。 我 能 立即 获得 反馈 , 而 且 只 要 在 程序 里 输 
入 就 能 知道 我 的 想法 是 否 有 效 。 

一 旦 弄 清 楚 如 何在 shell 里 做 某 些 事情 ， 我 通常 就 会 转 而 编写 makefile 和 一 些 代码 ， 重 现 我 
在 shell 里 学 到 的 内 容 。 





还 应 该 注意 模块 里 -Import 和 -export 声 明 的 用 法 。 
口 -import(Lists，[map/2，sum/1]) ,声明 的 意思 是 map/2 果 数 是 从 Lists 模 块 里 导入 的 ， 
后 面 的 也 一 样 。 这 就 意味 痢 我 们 可 以 用 map(Fun，. . .) 来 代 和 奉 Lists:map(Fun，...) 的 
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写法 了 。cost/1 没 有 在 导入 声明 中 声明 过 ， 因 此 必须 使 用 “完全 限定 ”( fully qualified ) 
的 名 称 sShop :cost。 
口 -export([totatL/1]) 声 明 的 意思 是 totaL/V1 函 数 可 以 在 shop2 模 块 之 外 调用 。 只 有 从 一 
个 模块 里 导出 的 丽 数 才能 在 该 模块 之 外 调用 。 
现在 , 你 可 能 会 认为 total 函 数 没 有 改进 的 空间 了 , 那样 你 就 错 了 。 进一步 的 优化 是 可 能 的 。 
为 了 做 到 这 一 点 ， 我 们 将 使 用 列表 推导 。 


4.5 列表 推导 


列表 推导 (listcomprehension ) 是 无 需 使 用 fun、map 或 filter 就 能 创建 列表 的 表达 式 。 它 让 
程序 变 得 更 短 ， 更 容易 理解 。 

我 们 从 一 个 例子 开始 。 假 设 有 一 个 列表 L， 

1>L = [1,2,3,4,5]. 

[1,2,3,4,5] 

并 且 想 要 让 列表 里 的 每 个 元 素 加 倍 。 虽 然 之 前 做 过 ， 但 在 这 里 再 次 展示 一 下 做 法 。 

2> Lists:map(fun(X) -> 2*X end，L) 

[2,4,6,8,10j 

而 用 列表 推导 的 方式 就 简单 多 了 。 

4> [2*X || X<- 上 L]. 

[2,4,6,8,10] 

[ F(X) || X <- Ll 标记 的 意思 是 “由 F(X) 组 成 的 列表 (X 从 列表 L 中 提取 》。 因 此 ，[2*X 
| | X <- 上 ] 的 意思 就 是 “由 2*X 组 成 的 列表 (X 从 列表 L 中 提取 )。 

要 了 解 如 何 使 用 列表 推导 , 可 以 在 shell 里 输入 一 些 表 达 式 , 看 看 会 发 生 什 么 ,我 们 从 定义 Buy 
开始 。 

1> Buy=[{oranges ,4}, {newspaper ,1}, {apples,10}, {pears,6}, {milk,3}]}. 

[{oranges,4}, {newspaper, 1}, {apples, 10}, {pears,6}, {milk,3}] 

现在 ， 把 原始 列表 里 每 一 项 的 数字 加 倍 。 

2> [{Name, 2*Number} || {Name, Number} <- Buy]. 

[{oranges,8}, {newspaper ,2}, {apples,20}, {pears, 12}, {milk,6}] 

请 注意 ，| | 符号 右 侧 的 元 组 {Name，,，Number} 是 一 个 模式 ， 用 于 匹配 列表 Buy 里 的 各 个 元 素 。 
左 侧 的 元 组 {Name，2*Number} 则 是 一 个 构造 器 ( constructor )。 

假设 想 要 计算 原始 列表 里 所 有 元 系 的 总 价 , 可 以 像 下 面 这 样 做 。 首先 将 每 一 项 的 名 称 蔡 换 成 
它 的 价格 。 


3> [{shop:cost(A)，B}+ || {A, B} <- Buy] . 
[{5,4}, {8,1},42,190},19,6},1{7,3}] 
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现在 让 两 个 数字 相 乘 。 


4> [Shop:cost(A) * B || {A, B} <- Buy]. 
[20,8,20,54,21] 


然后 把 它们 全 部 加 起 来 。 


5> lists:sum([shop:cost(A) * B || {A, B} <- Buy]). 


123 
最 后 ， 如 果 想 把 它 做 成 一 个 函数 ， 就 会 像 下 面 这 样 写 : 
total(L) -> 


lists:sum([shop:cost(A) * B || {A, B} <- L]). 

列表 推导 会 让 代码 变 得 非常 短 并 且 易 于 阅 旋 。 举 个 例子 ， 可 以 定义 一 个 进一步 答 化 的 map。 

map(F, L) -> [F(X) || XxX <- L]. 

列表 推导 最 常规 的 形式 是 下 面 这 种 表达 式 : 

[XxX || QuaLifier1l，QuaLifier2，,，,,] 

X 是 任意 一 条 表达 式 ， 后 面 的 限定 符 ( Qualifier ) 可 以 是 生成 咒 、 位 串 生 成 需 或 过 滤 需 。 

口 生成 器 (generator ) 的 写法 是 Pattern <- ListExpr， 其 中 的 ListExp 必 须 是 一 个 能 够 得 
出 列表 的 表达 式 。 

口 位 串 ( bitstring ) 生成 大 的 写法 是 BitStringPattern <= BitStringExpr， 其 中 的 
BitStringExpr 必 须 是 一 个 能 够 得 出 位 串 的 表达 式 。 更 多 有 关 位 串 模 式 和 生成 疾 的 信息 
请 参阅 Erlang 参 考 手 册 。 

口 过 滤 带 (filter ) 既 可 以 是 判断 图 数 ( 即 返 回 true 或 false 的 函数 ), 也 可 以 是 布尔 表达 式 。 

请 注意 ， 列 表 推 导 里 的 生成 融 部 分 起 厦 过 滤 需 的 作用 ， 这 里 有 一 个 例子 : 


J> [ XxX || {a, X} <- [{a,1},1b,2},{c,3},{a,4},hello,"wow"]]. 
[1,4] 


本 市 最 后 会 介绍 几 个 简短 的 例子 。 

















4.5.1 Quicksort 
以 下 是 如 何 用 两 个 列表 推导 来 编写 一 种 排序 算法 : 


lib_misc.erl 

qsort([]) -> [【]; 

qsort([Pivot|T]) -> 
qsort([X || X <- T, XxX < Pivot]) 
二 + [Pivot] ++ 
qsort([X || X <- T, X >= Pivot]). 


GD http:/www.erlang.org/doc/pdf/otp-system-documentation.pdf 


注意 这 里 的 ++ 是 中 级 插入 操作 符 。 





使 用 ++ 一 般 不 认为 是 良好 的 编程 实践 做 法 。 更 多 信息 请 参见 4.9 市 。 


1> L=[23,6,2,9,27,400,78,45,6]1,82,14]. 
[23,6,2,9,27,400,78,45,61,82,14] 

2> Lib misc:qsort(L). 
[2,6,9,14,23,27,45,61,78,82,400] 


为 了 了 解 它 是 如 何 工 作 的， 我 们 将 一 步 步 展 示 执 行 的 过 程 。 先 从 一 个 列表 L 开 始 ， 对 它 
步 匹 配 qsort 的 子 句 2， 


qsort(L)。 下 和 面 这 一 
[6,2,9,27,400,78,45,61,82,14]: 


3> [Pivot|T] = 
[23,6,2,9,27,400,78,45,61,82,14] 


产生 了 如 下 绑 定 : 
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展示 这 上段 代码 是 为 了 表现 它 的 优雅 ， 而 不 是 效率 。 这 样 


调用 
Pivot 一 23 和 T 一 








现在 将 T 分 成 两 个 列表 ， 一 个 包含 T 里 所 有 小 于 Pivot ( 中 位 数 ) 的 元 素 ， 另 一 个 包含 所 有 大 
于 或 等 于 Pivot 的 元 素 。 
4> Smaller = [X || X <- T, X < Pivot]. 
[6,2,9,14] 
5> Bigger = [X || X <- T, X >= Pivot]. 
[27,400,78,45,61,82] 
现在 排序 smaLLer 和 Bigger， 并 将 它们 与 Pivot 合 并 。 
qsort( [6,2,9,14] ) ++ [23] ++ qsort( [27,400,78,45,61,82] ) 
= [2,6,9,14] ++ [23] ++ [27,45,61,78,82,400] 
= [2,6,9,14,23,27,45,61,78,82,400] 
4.5.2” 毕 达 哥 拉 斯 三 元 数组 
毕 达 哥 拉 斯 三 元 数组 "是 由 整数 {A,B,C} 构 成 的 数组 ， 其 中 4 +B = 0”。 
pythag(N) 函数 会 生成 一 个 包含 所 有 整数 {A,B,C} 组 合 的 列表 ， 其 中 4 +B* =C 并 且 各 条 边 
之 和 小 于 等 于 N。 
lib_misc.erl 
pythag(N) -> 
[ {A,B,C} || 
A <- lists:seql(1,N), 
B <- lists:seq(1,N), 
C <- lists:seq(1,N), 
A+B+C =< N, 


A*A+B*B =:= C*C 


了 
简单 解释 一 下 : Lists:sedq(1,，N) 返 


由 即 勾 股 定理 中 的 勾 、 股 和 弦 。 一 一 译 者 注 


反 回 一 个 包含 从 1 到 N 所 有 整 


多 数 的 列表 。 因此 , A <- lists: 
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seq(1,N) 的 意思 是 A 提取 从 1 到 N 的 所 有 可 能 值 。 所 以 这 个 程序 可 以 这 样 念 :“ 提 取 1 到 N 的 所 有 4 
值 ，1 到 N 的 所 有 B 值 ，1 到 N 的 所 有 C 值 ， 条 件 是 4 + B+ C 小 于 等 于 N 并 且 A*A + B*B = C*C。” 

1> Lib misc:pythag(16). 

[{3,4,5}, {4,3,5}] 


2> Lib misc:pythag(30). 
[{3,4,5},14,3,5},145,12,13},16,8,10},18,6,10},1412,5,13}] 


4.5.3” 回 文 构 词 


如 果 你 对 更 式 填 字 游戏 感 兴 趣 ， 就 应 该 经 稼 在 琢 麻 回 文 构 词 ( anagram )。 让 我 们 借助 下 面 这 
个 精致 的 小 函数 perms ， 用 Erlang 来 找到 一 个 字符 串 的 所 有 排列 形式 。 





lib_misc.erl 


perms([]) -> [[]]; 
perms(L) -> [[HIT] || H <- L, T <- perms(L--[H])]. 


1> Lib misc:perms("123"). 
["123" "132" 人 "19213" . "23]1" "312" . "321"] 
2> Lib misc:perms("cats"). 


["cats", "cast", "ctas", "ctsa'", "csat", "csta", naets". "acst", 
"atcs", SEE = "Ste "tcas", "tcsa", "tacs", "ee 
"tsca", "tsac", "scat", "scta", "sact", "satc", "stca", "stac"] 


X -- Y 是 列表 移 除 操作 符 ， 它 从 X 里 移 除 Y 中 的 元 素 。8.16 节 提供 了 更 准确 的 定义 。 

perms 十 分 简洁 。 它 的 工作 方式 如 下 : 假设 想 要 计算 字符 串 "cats" 的 所 有 排列 形式 。 首 先 ， 
分 离 字 符 串 的 第 一 个 字符 ， 也 就 是 c， 并 计算 字符 串 移 除 c 后 的 所 有 排列 形式 。"cats" 移 除 c 后 是 
字符 串 "ats", 而 "ats" 的 全 部 排列 形式 是 以 下 学 符 串 : ["ats", "ast", "tas", "tsa", "sat", 
"sta"] 。 接 下 来 , 把 c 附 加 到 所 有 这 些 字 符 串 的 开头 , 形成 ["cats", "cast", "ctas", "ctsa", 
"csat"， "csta"] 。 然 后 继续 分 离 第 二 个 字符 并 重复 这 一 算法 ， 以 此 类 推 。 

perms 也 数 所 做 的 就 是 以 上 这 些 。 


[ [HIT] [|| H <- L, T <- perms(L -- [H]) ] 


它 的 意思 是 穷尽 一 切 可 能 从 L 里 提取 H， 然 后 穷尽 一 切 可 能 从 perms(L -- [H])( 即 列表 L 移 
除 H 后 的 所 有 排列 形式 ) 里 提取 T， 最 后 返回 [HIT] 。 


4.6 ”内置 函数 


内 置 函 数 人 简称 为 BIF (built-in function )， 是 那些 作为 Erlang 语 言 定 义 一 部 分 的 函数 。 有 些 内 
置 函数 是 用 Erlang 实 现 的 ， 但 大 多 数 是 用 Erlang 虚 拟 机 里 的 底层 操作 实现 的 。 

内 置 函 数 能 提供 操作 系统 的 接口 ， 并 执行 那些 无 法 用 Erlang 编 写 或 者 编写 后 非常 低 效 的 操 
作 。 比 如 ， 你 无 法 将 一 个 列表 转变 成 元 组 , 或 者 查 到 当前 的 时 间 和 日 期 。 要 执行 这 样 的 操作 ， 需 






































4.7 关卡 49 


要 调用 内 置 孙 数 。 

举 个 例子 ， 内 置 函 数 List_to_tuple/1 能 将 一 个 列表 转换 成 元 组 ，time/9 以 {时 ,分 ， 秒 } 
的 格式 返回 当前 的 时 间 。 

1> list to tuple([12,cat,"hello"]). 

{12,cat,"hello"} 

2> time(). 

{20,0,3} 

所 有 内 置 哨 数 部 表现 得 像 是 属于 erlang 模 块 ， 但 那些 最 常用 的 内 置 也 数 (例如 list_to_ 
tuple ) 是 自动 导入 的 ， 因 此 可 以 直接 调用 List to tuple(...)， 而 无 需 用 erlang:list to 
tuple(...)。 

可 以 在 erlang 于 册页 里 找到 所 有 内 置 函 数 的 完整 清单 ,， 它 位 于 Erlang 分 发 套装 内 , 也 可 以 在 
线 查看 : http://wwwi.erlang.org/doc/man/erlang.html。 在 本 书 余 下 部 分 里 ,我 只 会 介绍 理解 特定 章 
节 所 必需 的 内 置 孔 数 。 系统 中 的 内 置 哨 数 绝 不 止 本 书 里 介绍 的 这 些 , 因 此 建议 你 将 手册 页 打印 出 
来 ,， 试 大 去 了 解 所 有 的 内 置 函 数 。 


4.7 关卡 


关卡 ( guard ) 是 一 种 结构 ， 可 以 用 它 来 增加 模式 匹配 的 威力 。 通 过 使 用 关卡 ， 可 以 对 某 个 
模式 里 的 变量 执行 简单 的 测试 和 比较 。 假 设想 要 编写 一 个 计算 X 和 Y 之 间 最 大 值 的 max(X，Y) 了 所 
数 。 可 以 像 下 面 这 样 用 关卡 来 编号 它 : 

max(X, Y) when XxX > Y -> X; 

max(X, Y) -> Y. 

子 名 1 会 在 X 大 于 Y 时 匹配 ， 结 果 是 X。 

如 果子 句 1 不 匹配 ， 系 统 就 会 尝试 子 句 2。 子 句 2 总 是 返回 第 二 个 参数 Y。Y 必 人 然 是 大 于 或 等 于 
X 的 ， 否 则 子 句 1 就 已 经 匹配 了 。 

可 以 在 函数 定义 里 的 头 部 使 用 关卡 〈 通 过 关键 字 when 引 入 )， 也 可 以 在 文 持 表达 式 的 任何 地 
方 使 用 它们 。 当 它们 被 用 作 表 达 式 时 ， 执 行 的 结 朱 是 true 或 faLse 这 两 个 原子 中 的 一 个 。 如 末 关 
卡 的 值 为 true， 我 们 会 说 执行 成 功 ， 否 则 执行 失败 。 


4.7.1 关卡 序列 


关卡 序列 ( guard sequence ) 是 指 单一 或 一 系列 的 关卡 ， 用 分 号 ( ; ) 分 隔 。 对 于 关卡 序列 61; 
G2; ,.,.; Gn， 只 要 其 中 有 一 个 关卡 (G1l1、G2…… ) 的 值 为 true， 它 的 值 就 为 true。 

关卡 由 一 系列 关卡 表达 式 组 成 ， 用 逗号 (，) 分 隔 。 关 卡 GuardExpr1, GuardExpr2,... 
GuardExprN 只 有 在 所 有 的 关卡 表达 式 ( GuardExprl、GuardExpr2…… ) 都 为 true 时 才 为 true。 

合法 的 关卡 表达 式 是 所 有 合法 Erlang 表 达 式 的 一 个 子 集 。 之 所 以 限制 关卡 表达 式 只 能 是 
Erlang 表 达 式 子 集 ， 是 想 要 确保 关卡 表达 式 的 执行 是 无 副作用 的 。 关 卡 是 模式 匹配 的 一 种 扩展 ， 
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而 因为 模式 匹配 无 副作用 ， 所 以 我 们 不 硕 望 关卡 的 执行 市 有 副作用 。 
另外 ， 关 卡 不 能 调用 用 户 定 义 的 图 数 ， 因 为 要 确保 它们 没有 副作用 并 能 正 滑 结 
下 列 语 法 形式 是 合法 的 关卡 表达 式 : 
口 原子 true; 
口 其 他 常量 ( 各 种 数据 结构 和 已 绑 定 变量 )， 它 们 在 关卡 表达 式 里 都 会 成 为 false; 
口 调用 后 面 表 1 里 的 关卡 判断 函数 和 表 2 里 的 内 置 也 数 ; 
口 数据 结构 比较 ( 参见 表 6 ); 
口 算术 表达 式 ( 参见 表 3 ); 
口 布尔 表达 式 ( 参见 8.7 市 ); 
口 短路 布尔 表达 式 〈 人 参见 8.23 节 )。 














注意 阅读 表 1 和 表 2 时 你 会 看 到 里 面 引用 了 我 们 尚未 讨论 过 的 数据 类 型 。 它 们 是 出 于 完整 性 的 
考虑 而 被 纳入 这 些 表 格 的 。 


关卡 表达 式 的 执行 适用 于 8.20 节 里 介绍 的 优先 级 规则 。 
4.7.2 天 卡 示例 
我 们 已 经 讨论 过 关卡 的 语法 了 ， 它 有 时 会 变 得 相当 复杂 。 这 里 有 一 些 例子 : 


f(X,Y) when 1is linteger(X)，X>YY<6 -> .，,， 


它 的 意思 是 “ 当 X 是 一 个 整数 ，X 大 于 Y 并 且 Y 小 于 6 时 "。 关 卡 里 分 隅 各 个 测试 的 逗号 的 意思 














是 “并 且 ”。 
is tuple(T), tuple size(T) =:= 6, abs(element(3, T)) > 5 
element(4, X) =:= hd(L) 

















第 一 行 的 意思 是 T 是 一 个 包含 六 个 元 素 的 元 组 ， 并 且 T 中 第 三 个 元 素 的 绝对 值 大 于 5。 第 二 行 
的 意思 是 元 组 X 的 第 4 个 元 素 与 列表 L 的 列表 头 相 同 。 


X =:= dog; X =:= Cat 
is integer(X), X > Y ; abs(Y) < 23 




















第 一 个 关卡 的 意思 是 X 是 一 个 cat 或 者 dog， 关卡 里 分 号 ( ; ) 的 意思 是 “或 者 ”。 第 二 个 关卡 
的 意思 是 X 是 一 个 整数 ， 并 且 X 大 于 Y 或 者 Y 的 绝对 值 小 于 23。 

这 里 还 有 一 些 关 卡 的 例子 ， 它 们 使 用 了 短路 布尔 表达 式 : 

A >= -1.0 andalso A+1 > B 

js atom(L) orelse (is list(L) andalso length(L) > 2) 

允许 布尔 表达 式 用 于 关卡 是 为 了 使 关卡 在 语法 上 类 似 于 其 他 的 表达 式 。orelse 和 andalso 
操作 符 存在 的 原因 是 布尔 操作 符 and/or 原 本 的 定义 是 两 侧 参 数 都 需要 求 值 。 在 关卡 里 ,( and 与 
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andalso ) 之 则 和 (or 与 orelse ) 之 间 可 能 会 存在 差别 。 举 个 例子 ， 请 考虑 下 面 这 两 个 关卡 : 
f(xX) When (X == 0) or (1/X > 2) -> 


g(xX) when (X == 0) orelse (1/X > 2) -> 


当 X 为 0 时 ，f(X) 里 的 关卡 会 失败 ， 但 g(X) 里 的 关卡 会 成 功 。 
在 实践 中 ， 很 少 有 程序 会 使 用 复杂 的 关卡 ， 人 简单 的 (，) 关卡 已 能 满足 大 多 数 程序 的 要 求 。 
4.7.3 true 关 卡 的 作用 


你 可 能 会 疑惑 为 什么 会 需要 true 关 卡 。 原 因 是 原子 true 可 以 被 当 作 “来 者 不 拒 ” 的 关卡 ， 
放置 在 某 个 if 表 达 式 的 最 后 ， 就 像 这 样 : 


if 








Guard -> Expressions; 
Guard -> Expressions,; 


true -> Expressions 
end 


我 们 会 在 4.8.2 节 中 讨论 if。 
面 这 些 表 格 列 出 了 所 有 的 关卡 判断 函数 ( 即 返 回 布尔 值 的 关卡 ) 和 所 有 的 关卡 内 置 函 数 。 


表 1 关卡 判断 函数 





判断 函数 
is atom(X) 
is binary(X) 
is constant(X) 
is float(X) 
is function(X) 
is function(X, N) 
is integer(X) 
is list(X) 
is map(X) 
is number(X) 
is pid(X) 
is pmod(X) 
is port(X) 
is reference(X) 
is tuple(X) 
is record(X,Tag) 


is record(X,Tag,N) 


mH 
CE 田 


巴 一 不 原子 

X 是 一 个 二 进 制 型 

X 是 一 个 常量 

X 是 一 个 浮 点 数 

X 是 一 个 fun 

X 是 一 个 带 有 NN 个 参数 的 fun 
X 是 一 个 整数 

X 是 一 个 列表 

X 和 是 一 个 映射 组 

X 是 一 个 整数 或 浮 点 数 

X 是 一 个 进程 标识 符 

X 是 一 个 参数 化 模块 的 实例 
X 和 是 一 个 病 

X 是 一 个 引用 

X 是 一 个 元 组 

X 是 一 个 类 型 为 Tag 的 记录 
X 是 一 个 类 型 为 T a9、 大 小 为 N 的 记录 


表 2 关卡 内 置 函 数 


函数 意思 
abs (X) X 的 绝对 值 
byte size(X) X 的 字 节 数 ，X 必 须 是 一 个 位 串 或 二 进 制 型 
element (N, X) Xx 里 的 元 素 N， 注 意 X 必 须 是 一 个 元 组 
float (X) 将 Xx 转换 成 一 个 浮 点 数 ，X 必 须 是 一 个 数字 
hd(X) 列表 X 的 列表 头 
Length(X) 列表 X 的 长 度 
node() 当前 的 节点 
node (X) 创建 X 的 节点 ，X 可 以 是 一 个 进程 、 标 识 符 、 引 用 或 端口 
round (X) 将 Xx 转换 成 一 个 整数 ，X 必 须 是 一 个 数字 
self() 当前 进程 的 进程 标识 符 
size(X) X 的 大 小 ， 它 可 以 是 一 个 元 组 或 二 进 制 型 
trunc(X) 将 X 去 掉 小 数 部 分 取 整 ，X 必 须 是 一 个 数字 
tL(X) 列表 X 的 列表 尾 
tuple size(T) 元 组 T 的 大 小 


4.8 case 和 if 表达 式 


到 目前 为 止 ， 所 有 的 问题 我 们 都 用 模式 匹配 解决 。 这 让 Erlang 代 码 小 而 一 致 。 但 是 ， 为 所 有 
问题 都 单独 定义 函数 子 名 有 时 候 很 不 方便 。 这 时 ， 可 以 使 用 case 或 if 表达 式 。 

















4.8.1 case 表达 式 
case 的 语法 如 下 : 


case Expression of 
Pattern1l [when Guardl] -> Expr seql; 
Pattern2 [when Guard2] -> Expr seq2; 


end 


case 的 执行 过 程 如 下 : 首先 ，Expression 被 执行 ,假设 它 的 值 为 Value。 随 后 ，Value 轮 流 
与 Pattern1 ( 带 有 可 选 的 关卡 Guard1 )、Pattern2 等 模式 进行 匹配 ， 直 到 匹配 成 功 。 一 旦 发 现 
匹配 ,相应 的 表达 式 序 列 就 会 执行 ,而 表达 式 序列 执行 的 结果 就 是 case 表 达 陈 的 值 。 如 果 所 有 模 
式 都 不 匹配 ， 就 会 发 生 异 党 错误 ( exception )。 

之 前 用 过 一 个 名 为 fiLter(P，L) 的 果 数 ， 它 返回 一 个 列表 ， 内 含 L 里 所 有 满足 条 件 的 元 素 X 
(条 件 是 P(X) 为 true )。 可 以 像 下 面 这 样 用 case 来 定义 filter: 

filter(P, [HIT]) -> 

case P(H) of 


true -> [H|filter(P, T)]; 
false -> filter{(P, T) 
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end ; 
filter(P, []) -> 
[]. 
严格 来 说 ，case 不 是 必需 的 。 下 面 展示 了 如 何 只 用 模式 匹配 来 定义 fiLter: 


fiLter(P，[HIT]) -> filterl(P(H), H, P, T); 
filter(P, [])} a | 





filterl(true, H, P, T) -> [H|filter(P, T)]; 
filterl(false, H, P, 1T) -> filter(P, T). 


废弃 的 关卡 函 数 
如 果 你 遇 到 一 些 编写 于 几 年 前 的 Erlang 旧 代码 ， 里面 的 关卡 测试 名 称 可 能 会 不 一 样 。 旧 代 
码 使 用 的 关卡 测试 名 为 atom(X) 、constant(X) 、fLoat(X) 、integer(X) 、List(X) 、 
number(X) 、pid(X) 、port(X)、reference(X)、tuple(X) 和 binary(X) 。 这 些 测 试 与 
is_atom(X) 等 现代 版 测试 的 含义 相同 。 建 议 不 要 在 如 今 的 代码 里 使 用 这 些 旧名 称 。 


这 个 定义 比较 丑陋 。 必 须 创 建 一 个 额外 的 聘 数 ( 名 为 filterl)， 并 向 它 传 递 filter/2 的 所 
有 参数。 


4.8.2 if 表达 式 


Erlang 还 提供 了 第 二 种 条 件 句 式 if， 语 法 如 下 : 


if 
Guardl -> 
Expr seqd1l,; 
Guard2 -> 
Expr sed2， 


end 

它 的 执行 过 程 如 下 : 首先 执行 G6uard1。 如 果 得 到 的 值 为 true， 那么 if 的 值 就 是 执行 表达 式 
序列 Expr_seq1l 所 得 到 的 值 。 如 果 Guard1 不 成 功 ， 就 会 执行 G6uard2， 以 此 类 推 ， 直 到 某 个 关卡 
成 功 为 止 。if 表 达 式 必须 至 少 有 一 个 关卡 的 执行 结果 为 true， 否 则 就 会 发 生 异 党 错误 。 

很 多 时 候 ，if 表 达 式 的 最 后 一 个 关卡 是 原子 true， 确 保 当 其 他 关卡 都 失败 时 表达 式 的 最 后 
部 分 会 被 执行 。 

有 一 点 可 能 会 让 人 困惑 ， 就 是 在 if 表达 式 的 最 后 使 用 true 关 卡 。 如 果 使 用 C 之 类 的 语言 ， 编 
写 不 之 else 部 分 的 if 语 句 是 可 行 的 ， 就 像 这 样 : 

if( a > 0) { 

do_ this(); 














} 
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因此 ， 你 可 能 会 想 要 在 Erlang 里 编写 下 面 的 代码 : 
if 
六 > 日 -> 
do _ this ( ) 

end 

这 样 做 在 Erlang 里 可 能 会 种 来 问题 ， 因 为 if 是 一 种 表达 式 ， 而 所 有 的 表达 式 都 应 该 有 值 。 在 
A 小 于 或 等 于 0 的 情况 下 ， 这 个 if 表 达 式 是 没有 值 的 。 这 在 Erlang 里 属于 错误 ,会 导致 程序 朋 尝 ， 
但 在 C 里 不 算是 错误 。 

为 了 避免 可 能 的 异常 错误 ,Erlang 程序 员 经 常会 在 if 表 达 式 的 最 后 瀛 加 一 个 true 关 卡 , 当 然 ， 
如 果 他 们 想 让 异常 错误 生成 ， 就 会 省 略 额 外 的 true 关 卡 。 


4.9 ”构建 自然 顺序 的 列表 


构建 列表 最 有 效率 的 方式 是 癌 某 个 现成 列表 的 头 部 添加 元 素 , 因此 经 常 能 看 到 包含 以 下 模式 
的 代码 : 


























some_ function([H|T], ..., Result, ...) -> 
HL SS wos hh wny 
some function(T, ..., [Hl|Result], ...); 
some function([], ..., Result, ...) -> 
{...,， Result, ...}. 





这 上 段 代码 会 遇 历 一 个 列表 ， 提 取出 列表 头 H 并 根据 函数 的 算法 计算 出 某 个 什 〈 可 以 称 之 为 
H1 )， 然 后 把 Hl 添加 到 输出 列表 Resutt 里 。 当 输入 列表 被 穷尽 后 ,最 后 的 子 句 匹配 成 功 ， 孙 数 返 
回 输 出 变量 Result。 

ResutLt 的 元 素 顺 序 和 原始 列表 的 元 素 有 顺序 是 相反 的 ， 这 也 算 不 上 什么 问题 。 如 采 它 们 的 顺 
序 是 错误 的 ， 可 以 很 容 匈 在 最 后 一 步 里 反 转 过 来 。 

它 的 基本 概念 相当 简单 。 

(1) 总 是 问 列 表 头 添加 元 素 。 

(2) 从 输入 列表 的 头 部 提取 元 素 ， 然 后 把 它们 座 加 到 输出 列表 的 头 部 ， 形 成 的 结果 是 与 输入 
列表 顺序 相反 的 输出 列表 。 

(3) 如 果 顺 序 很 重要 ， 就 调用 Lists: reverse/1 这 个 高 度 优 化 过 的 函数 。 

(4) 避免 违反 以 上 的 建议 。 

















注意 ， 每 当 想 要 反 转 一 个 列表 时 ， 都 应 该 调用 Lists:reverse， 别 用 其 他 的 做 法 。 如 果 查 看 列 
表 模 块 的 源 代 码 ， 会 发 现 reverse 的 定义 。 但 是 ， 这 个 定义 仅仅 是 用 来 帮助 理解 的 。 当 
编译 器 发 现 对 Lists:reverse 的 调用 时 ， 会 调用 此 函数 的 一 个 更 高 效 的 内 部 版 本 。 





只 要 看 到 像 下 面 这 样 的 代码 ， 承 应 该 注意 了 ， 因 为 这 是 非常 低 效 的 ， 只 有 List 很 短 时 才 勉 
强 可 用 : 


List ++ [H] 

虽然 ++ 可 能 会 导致 低 效 的 代码 ， 但 是 在 清晰 度 和 性 能 之 间 需 要 进行 权衡 。 使 用 ++ 可 以 让 程 
序 更 清晰 闻 时 也 不 存在 性 能 问题 。 最 佳 做 法 是 首先 把 程序 编写 得 尽 可 能 清晰 , 然后 ， 如 果 有 性 能 
问题 ， 先 测量 再 进行 优化 。 





4.10 ” 归 集 器 


我 们 经 常会 想 要 让 一 个 函数 返回 两 个 列表 。 举 个 例子 ,我们 可 能 会 想 编写 一 个 函数 ,把 条 个 
整数 列表 一 分 为 二 ， 分别 包 含 原始 列表 里 的 奇数 和 侦 数 。 下 面 是 一 种 做 法 : 


lib_misc.erl 

odds and evensl(L) -> 
Odds [X || XxX <- L, (X rem 2) 
Evens [X || XxX <- L, (XxX rem 2) 
{0dds, Evens}. 


1] ， 
0]， 


5> lib misc:odds and _ evensl([1,2,3,4,5,6])， 
{[1,3,5],12,4,6]} 


这 段 代码 的 问题 在 于 : 遍历 了 列表 两 次 。 如 来 列表 很 怎 则 问题 不 大 , 但 如 末 列 表 很 长 ， 丈 可 
能 是 个 问题 。 


有 要 避 倪 志 历 列表 两 次 ， 可 以 重 写 代 码 如 下 : 








lib_misc.erl 


odds and evens2(L) -> 
odds and evens acc(L, {], {1]). 


odds and evens acc({HIT], Odds, Evens) -> 
case (H rem 2) of 
1 -> odds and evens acc{(T, [HIOQdds], Evens); 
0 -> odds and evens acc(T, Odds, [H|Evens}]) 
end; 
odds and evens acc({[], Odds, Evens) -> 
{Odds, Evens}. 
现在 程序 只 遍历 列表 一 次 ， 把 奇偶 参数 分 别 添加 到 合适 的 列表 里 。 这 些 列表 被 称 为 归 集 器 
(accumulator )。 这 上段 代码 还 有 一 个 不 太 明 显 的 额外 的 优点 : 市 归 集 侣 的 版 本 比 [H | | filter(H)]】 
类 型 结构 的 版 本 更 节省 空间 。 
如 来 运行 这 段 代 码 ， 得 到 的 结果 和 之 前 几乎 一 样 。 
1> Llib misc:odds and evens2([1,2,3,4,5,6]). 
{[5,3,1],[6,4,2]} 
区 别 在 于 : 奇偶 列表 里 的 元 素 顺 序 是 反 转 的 。 这 是 列表 的 构建 方式 所 导致 的 结果 。 如 采 想 让 
列表 元 素 的 顺序 和 最 初 的 一 致 ， 只 需 在 函数 最 后 的 子 句 里 反 转 这 些 列 表 即 可 ， 做 法 是 修改 
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odds and evens2 的 第 二 个 子 句 : 


odds and evens acc([], Odds, Evens) -> 
{lists:reverse(tOdds), lists:reverse({Evens)})}. 


现在 你 已 经 有 足够 的 知识 来 编写 和 理解 大 量 的 Erlang 代 码 了 。 我 们 讨论 了 模块 与 响 数 的 基本 
结构 ， 以 及 编写 顺序 程序 所 需要 的 大 多 数控 制 结 构 与 编程 技巧 。 

Erlang 还 有 两 种 数据 类 型 ， 名 为 记录 和 映射 组 。 它 们 都 被 用 于 保存 复杂 的 数据 类 型 。 记 录 的 
作用 是 给 某 个 元 组 里 的 元 系 赋 名 。 这 在 元 组 包含 大 量 元 素 时 很 有 用 。 记 录 和 映射 组 是 下 一 音 的 主 


有 页 。 
































4.11 练习 


找到 erlang 模 块 的 手册 页 。 你 会 看 到 它 列 出 了 大 量 的 内 置 函 数 ( 远 多 于 我 们 在 这 里 讨论 过 
的 )。 可 以 用 这 些 信息 来 解决 下 面 列 出 的 一 些 问题 。 

(扩展 geometry.erL。 添加 一 些 子 句 来 计算 圆 和 直角 三 角形 的 面积 。 添 加 一 些 子 句 来 计算 
各 种 几何 图 形 的 周 长 。 

(2) 内 置 函 数 tuple to List(T) 能 将 元 组 T 里 的 元 素 转 换 成 一 个 列表 。 请 编写 一 个 名 为 
my_tupte to_List(T) 的 晒 数 来 做 同样 的 事 ， 但 不 要 使 用 相同 功能 的 内 置 另 数 。 

(3) 查看 erlang:now/0 、erlang:date/0 和 erlang:time/0 的 定义 。 编 写 一 个 名 为 
my_time func(F) 的 函数 ,让 它 执行 fun F 并 记 下 执行 时 间 。 编写 一 个 名 为 my_date _ string() 的 
遇 数 ， 用 它 把 当前 的 日 期 和 时 间 改 成 整齐 的 格式 。 

(4) 高 级 练习 : 查找 Python datetime 模 块 的 手册 页 。 找 出 Python 的 datetime 类 里 有 多 少 方法 
可 以 通过 erlang 模 块 里 有 关 时 间 的 内 置 函数 实现 。 在 ertlang 的 手册 页 里 查找 等 价 的 函数 。 如 果 
有 明显 的 遗 源 ， 就 实现 它 。 

(5) 编写 一 个 名 为 math functions .erl 的 模块 , 并 导出 了 滁 数 even/1 和 odd/1。even(X) 呆 数 
应 当 在 Xx 是 偶 整 数 时 返回 true， 否 则 返回 false。odd(X) 应 当 在 Xx 是 奇 整数 时 返回 true。 

(6) 向 math functions .erl 添 加 一 个 名 为 fitlter(F，L) 的 高 阶 函数 ， 它 返回 L 里 所 有 符合 
条 件 的 元 素 X (条 件 是 F(X) 为 true )。 

(7) 回 math_ functions,ertL 添 加 一 个 返回 {Even，0dd} 的 spLit(L) 国 数 ， 其 中 Even 是 一 个 
包含 L 里 所 有 偶数 的 列表 ，0dd 是 一 个 包含 L 里 所 有 奇数 的 列表 。 请 用 两 种 不 同 的 方式 编写 这 个 果 
数 ， 一 种 使 用 归 集 硕 ， 另 一 种 使 用 在 练习 6 中 编写 的 fiLter 函 数 。 












































记录 与 映射 组 


到 目前 为 止 , 我 们 已 经 讨论 了 两 种 数据 容 备 ,分别 是 元 组 和 列表 。 元 组 用 于 保存 固定 数量 的 
元 系 ， 而 列表 用 于 保存 可 变数 量 的 元 素 。 

本 草 将 介绍 记录 (record ) 和 映射 组 (map )。 记 录 其 实 束 是 元 组 的 男 一 种 形式 。 通 过 使 用 记 
录 ， 可 以 给 元 组 里 的 各 个 元 系 关 联 一 个 名 称 。 

映射 组 是 键 - 值 对 的 关联 性 集合 。 键 可 以 是 任意 的 Erlang 数 据 类 型 。 它们 在 Perl 和 Ruby 里 被 称 
为 散 列 〈hash )， 在 C++ 和 Java 里 被 称 为 映射 (map )， 在 Lua 里 被 称 为 表 (table )， 在 Python 里 则 被 
称 为 字典 ( dictionary )。 

使 用 记录 和 映射 组 能 让 编程 更 容易 。 与 其 记 住 某 个 数据 项 在 复杂 数据 结构 里 的 存放 位 置 , 不 
如 使 用 该 项 的 名 称 ， 让 系统 找到 数据 存放 的 位 置 。 记 录 使 用 一 组 固定 且 预 定义 的 名 称 ， 而 映射 组 
可 以 动态 添加 新 的 名 称 。 


5.1 何 时 使 用 映射 组 或 记录 


记录 其 实 就 是 元 组 的 另 一 种 形式 , 因此 它们 的 存储 与 性 能 特性 和 元 组 一 样 。 映射 组 比 元 组 占 
用 更 多 的 存储 空间 ， 查 找 起 来 也 更 慢 。 而 男 一 方面 ， 映 射 组 比 元 组 要 灵活 得 多 。 

应 该 在 下 列 情形 里 使 用 记录 : 

口 当 你 可 以 用 一 些 预先 确定 且 数 量 固 定 的 原子 来 表示 数据 时 ; 

口 当 记 录 里 的 元 素数 量 和 元 素 名 称 不 会 随时 间 而 改变 时 ; 

口 当 存储 空间 是 个 问题 时 ， 典 型 的 案例 是 你 有 一 大 堆 元 组 ， 并 且 每 个 元 组 都 有 相同 的 结构 。 

映射 组 适合 以 下 的 情形 : 

口 当 键 不 能 预先 知道 时 用 来 表示 键 - 值 数据 结构 ; 

口 当 存 在 大 量 不 同 的 键 时 用 来 表示 数据 ; 

口 当 方便 使 用 很 重要 而 效率 无 关 紧要 时 作为 万 能 的 数据 结构 使 用 ; 

口 用 作 “ 目 解释 型 ”的 数据 结构 ， 也 就 是 说 ， 用 户 容 易 从 键 名 猜 出 值 的 含义 ; 

口 用 来 表示 键 - 值 解 析 树 ， 例 如 XML 或 配置 文件 ; 

口 用 JSON 来 和 其 他 编程 语言 通信 。 
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5.2 通过 记录 命名 元 组 里 的 项 


对 于 小 型 元 组 而 言 , 记 住 各 个 元 素 代表 什么 几乎 不 成 问题 , 但 当 元 组 包含 大 量 元 素 时 , 给 各 
个 元 素 命 名 就 更 方便 了 。 一 旦 命名 了 这 些 元 素 ， 就 可 以 通过 名 称 来 指 回 它 们 ， 而 不 必 记 住 它 们 在 
元 组 里 的 具体 位 置 。 
用 记录 声明 来 命名 元 组 里 的 元 素 ， 它 的 语法 如 下 : 
-record(Name, { 
%% 以 下 两 个 键 带 有 上 默认 值 


keyl = Default]l, 
key2 = Default2, 


























和 5 下 一 行 就 相当 于 Key 3 = undefined 
3, 


Fs 


警告 record 不 是 一 个 shell 命 令 (在 shell 里 要 用 Fr， 详 见 本 节 后 面 的 描述 )。 记 录 声 明 只 能 在 
Erlang 产 代码 模块 里 使 用 ， 不 能 用 于 shell。 


在 之 前 的 例子 里 ，Name 是 记录 名 。key1、key2 这 些 是 记录 所 含 各 个 字段 的 名 称 ， 它 们 必须 
是 原子 。 记 录 里 的 每 个 字段 都 可 以 带 一 个 默认 值 ， 如 果 创 建 记 录 时 没有 指定 某 个 字段 的 值 ， 就 会 
使 用 默认 值 。 

举 个 例子 ， 假 设想 要 操作 一 个 待 办 事项 列表 。 我 们 会 首先 定义 一 个 todo 记 录 ， 然 后 将 它 保 
存在 一 个 文件 里 (记录 的 定义 既 可 以 保存 在 Erlang 源 代码 文件 里 ,也 可 以 由 扩展 名 为 ,hrL 的 文件 
保存 ， 然 后 包含 在 Erlang 源 代码 文件 里 )。 

请 注意 ， 文 件 包 含 是 唯一 能 确保 多 个 Erlang 模 块 共享 相同 记录 定义 的 方式 。 它 类 似 于 C 语 言 
用 .h 文 件 保 存 公 共 定 义 ， 然 后 包含 在 源 代 码 文件 里 。 有 关 包 含 命令 的 详细 内 容 请 参阅 8.15 市 。 














records.hrl 

-record(todo, {status=reminder,who=joe, text}). 

记录 一 旦 被 定义 ， 就 可 以 创建 该 记录 的 实例 了 。 

要 在 shell 里 这 么 做 ， 必 须 先 把 记录 的 定义 读 和 人 shell， 然 后 才能 创建 记录 。 我 们 将 用 shell 函 数 
rr (tead records 的 缩写 ， 即 该 取 记 录 ) 来 实现 。 


1> rr("records.hrl"}). 
[todo] 
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5.2.1 创建 和 更 新 记录 
现在 我 们 已 经 准备 好 定义 和 操作 记录 了 。 


2> #todo{}. 
#todo{status = reminder,who = joe,text = undefined} 
3> Xl1 = #todo{status=urgent, text="Fix errata In book"}. 





#todo{status = Urgent ,who = joe,text = "Fix errata In book"} 
4> X2 = Xl#todo{status=done}. 
#todo{status = done,who = joe,text = "Fix errata in book"} 


我 们 在 第 2 行 和 第 3 行 创建 了 新 的 记录 。 语 法 #todo{key1=Val1l，...，KkeyN=ValN} 用 于 创 
建 一 个 类 型 为 todo 的 新 纪录 。 所 有 的 键 都 是 原子 ,而 且 必须 与 记录 和 定义 里 所 用 的 一 致 。 如 果 省 略 
了 一 个 键 ， 系 统 就 会 用 记录 和 定义 里 的 值 作为 该 键 的 默认 值 。 
在 第 4 行 复制 了 一 个 现 有 的 记录 。 语法 X1#todo{status=done} 的 意思 是 创建 一 个 X1 的 副本 5 
( 类 型 必须 是 todo )， 并 修改 字段 status 的 值 为 done。 请 记 住 ， 这 么 做 生成 的 是 原始 记录 的 一 个 
副本 ， 原 始 记 录 没 有 变化 。 











5.2.2 提取 记录 字段 
要 在 一 次 操作 中 提取 记录 的 多 个 字段 ， 可 以 使 用 模式 匹配 。 


5> #todo{who=W, text=Txt} = X2. 

#todo{status = done,who = joe,text = "Fix errata In book"} 
b> W. 

joe 

/> Txt. 

"Fix errata In book" 


我 们 在 匹配 操作 符 (= ) 的 左 侧 编 号 了 一 个 记录 模式 ， 包 含 了 未 绑 定 变量 W 和 Txt。 如 有 果 匹 配 
成 功 ， 这些 变量 就 会 绑 定 记录 里 的 相应 字段 。 如 果 只 是 想 要 记录 里 的 单个 字段 ， 就 可 以 使 用 “点 
语法 ”来 提取 该 字段 。 

8> XZ#todo ,teXxt ， 

"Fix errata in book" 


























5.2.3 在 函数 里 模式 匹配 记录 
我 们 可 以 编写 模式 匹配 记录 字段 或 者 创建 新 记录 的 函数 ， 代 码 如 下 所 示 。 


clear status(#todo{status=S5S, who=W} = R) -> 


%% 在 此 函数 内 部 ，9 和 W 绑 定 了 记录 里 的 字段 值 
%% vatues In the record 


%% R 是 * 整 个 * 记 录 
R#todo{status=finished} 


包 
“6 时 时 外 
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要 匹配 菜 个 类 型 的 记录 ， 可 以 这 样 编 与 轴 数 定义 。 


do_something(X) when 1S_record(X，todo) -> 


[着 
676 


这 个 子 句 会 在 X 是 todo 类 型 的 记录 时 匹配 成 功 。 


5.2.4 记录 是 元 组 的 另 一 种 形式 





记录 其 实 就 是 元 组 。 
9> X2， 
#todo{status = done,who = joe,text = "Fix errata In book"} 


现在 我 们 要 i 上 shell 忘 掉 todo 的 定义 。 


10> rf(todo). 

ok 

了 了 > X2., 

{ttodo ,done,joe，，Fix errata in book"} 

在 第 10 行 里 ，rf(todo) 命 令 使 shell 忘 了 todo 记 录 的 定义 。 因 此 ， 现 在 打印 X2 时 ，shell 将 X2 
显示 成 一 个 元 组 。 其 实 它 们 在 系统 内 部 都 是 元 组 , 但 记录 提供 了 方便 的 语法 ,让 你 可 以 用 名 称 而 
非 位 置 来 指明 不 同 的 元 素 。 


5.3 了 映射 组 : 关联 式 键 - 值 存储 


映射 组 从 Erlang 的 R17 版 开始 可 供 使 用 。 

映射 组 具有 下 列 属 性 。 

口 映射 组 的 声 法 与 记录 相似 ， 不 同 之 处 是 省 略 了 记录 名 ， 并 且 键 - 值 分 隔 符 是 => 或 :=。 

口 映 册 组 是 键 - 值 对 的 关联 性 集合 。 

口 映射 组 里 的 键 可 以 是 任何 全 绑 定 的 Erlang 数 据 类 型 ( 即 数据 结构 里 没有 任何 未 绑 定 变量 )。 
口 映射 组 里 的 各 个 元 素 根据 键 进行 排序 。 

口 在 不 改变 键 的 情况 下 更 新 映射 组 是 一 种 市 省 空间 的 操作 。 

口 查询 映射 组 里 某 个 键 的 值 是 一 种 高 效 的 操作 。 

口 映射 组 有 痢 明 确 的 顺序 。 

我 们 将 在 下 面 几 和 里 更 详细 地 介绍 映射 组 。 


5.3.1 映射 组 语法 
映射 组 的 写法 依照 以 下 语法 : 


#{ Keyl Op Vall, Key2 Op Val2, ..., KeyN Op ValN } 
它 的 语法 与 记录 相似 , 但 是 散 列 符号 ( 即 #) 之 后 没有 记录 名 ， 而 0p 是 => 或 := 这 两 个 符号 的 


















































$.3 ”映射 组 : 关联 式 键 - 值 存 储 61 


de 

键 和 值 可 以 是 任何 有 效 的 Erlang 数 据 类 型 。 举 个 例子 , 假设 要 创建 一 个 包含 a、b 两 个 键 的 映 
射 组 。 

1> Fl = #{ a => 1, b => 2 }. 

#{ da => 1], b => 2 }. 


或 者 假设 要 创建 一 个 带 有 非 原 子 键 的 映射 组 。 


2> Facts = #{ {wife,fred} => "Sue", {age, fred} => 45, 
{daughter,fred} => "Mary", 
{likes, jim} => [...]}. 
#{ {age, fred} => 45, {daughter,fred} => "Mary", ...} 
映射 组 在 系统 内 部 是 作为 有 序 集合 存储 的 , 打印 时 总 是 使 用 各 键 排序 后 的 顺序 , 与 映射 组 的 
创建 方式 无 关 。 这 里 有 一 个 例子 : 
3> F2 = #{ b => 2, a => 1 }. 
#{ a => 1, b => 2 }. 
4> Fl = F2. 
#{ a => 1, b => 2 }. 
要 基于 现 有 的 映射 组 更 新 一 个 映射 组 ， 我 们 会 使 用 如 下 语法 ， 其 中 的 0p〈 更 新 操作 符 ) 是 
=> 或 "= 。 


NewMap = OldMap # { Kl Op V1,...,Kn Op Vn } 


表达 式 K => V 有 两 种 用 途 ， 一 种 是 将 现 有 键 K 的 值 更 新 为 新 值 Y， 男 一 种 是 给 映射 组 添加 一 
个 全 新 的 K-V 对 。 这 个 操作 总 是 成 功 的 。 

表达 式 K := V 的 作用 是 将 现 有 键 K 的 值 更 新 为 新 值 V。 如 果 被 更 新 的 映射 组 不 包含 键 K， 这 个 
操作 就 会 失败 。 

5> F3 = Fl#{ ¢ => xx }. 

#{ a => xx, bb => 2 ，KC => Xxx} 

6> F4 = FIl#{ Cc := 3} 

** exception error: bad argument 

key C does not exist in old map 

使 用 := 操作 符 有 两 个 重要 原因 。 首 先 ， 如 果 拼 错 了 新 键 的 名 称 ， 我 们 希望 会 有 错误 发 生 。 
如 有 果 创 建 了 一 个 映射 组 Var = #{keypos => 1，...}， 然后 用 Var #{key_pos := 2 } 更 新 它 ， 
那么 几乎 可 以 肯定 拼 错 了 键 名 ， 而 我 们 需要 知道 这 一 点 。 第 二 个 原因 和 效率 有 关 。 如 末 在 映 喘 组 
更 新 操作 里 只 使 用 := 操作 符 , 那么 我 们 就 知道 新 旧 映 射 组 都 向 有 一 组 相同 的 键 , 因此 可 以 共 至 相 
同 的 键 描述 符 。 假 如 我 们 有 一 个 包含 数 百 万 映射 组 的 列表 ,， 并且 它们 的 各 个 键 都 相同 ,那么 所 节 
省 的 空间 是 很 可 观 的 。 

使 用 映射 组 的 最 佳 方式 是 在 首次 定义 某 个 键 时 总 是 使 用 Key => Val， 而 在 修改 具体 某 个 键 
的 值 时 都 使 用 Key := Val。 
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5.3.2 ”模式 匹配 映射 组 字段 


用 来 编写 映射 组 的 => 语 法 还 可 以 作为 映射 组 模式 使 用 。 和 之 前 一 样 ， 映 射 组 模式 里 的 键 不 
能 包含 任何 未 绑 定 变量 ， 但 是 值 现在 可 以 包含 未 绑 定 变量 了 【在 模式 匹配 成 功 后 绑 定 )。 

















其 他 语言 里 的 映射 组 
请 注意 ，Erlang 的 映射 组 与 其 他 许多 语言 里 的 相应 结构 有 着 非常 不 同 的 工作 方式 。 要 阐释 
这 一 点 ， 我 们 可 以 来 看 看 在 JavaScript 里 会 发 生 什 么 。 
假设 在 JavaScript 里 做 下 面 这 些 事 : 


var x = {status:'old', task:'feed cats'}; 
var y = Xx; 
y.status = 'done',; 


y 的 值 是 对 象 {status:'done'，task: 'feed cats'}。 这 没什么 疑问 。 但 奇怪 的 是 ，xX 
也 变 成 了 {status:'done'，task:'feed cats'}。 这 对 Erlang 程 序 员 而 言 是 个 很 大 的 意外 。 
我 们 的 确 修 改 了 变量 x 里 某 个 字段 的 值 ， 但 并 不 是 通过 操作 X， 而 是 给 变量 y 的 某 个 字段 指派 了 
一 个 值 。 通 过 别名 指针 修改 x 会 寻 致 很 多 微妙 的 错误 ， 调试 起 来 会 非常 困难 。 

逻辑 上 等 价 的 Erlang 代 码 如 下 : 


D1 {status=>old, task=>'feed cats'}, 
D2 D1l#{status := done}, 


在 Erlang 代 码 里 ,变量 D1 和 D2 不 会 改变 它们 的 初始 值 。D2 的 表现 就 像 是 对 D1 做 了 深层 复制 一 
样 。 事 实 上 ， 诬 层 复制 并 没有 发 生 ，Erlang 系 统 只 复制 了 内 部 结构 里 的 某 些 必要 部 分 ， 以 形成 创 
建 了 复制 物 的 假象 。 因 此 ， 创 建 一 个 看 似 某 个 对 和 象 深 层 复制 物 的 操作 是 极其 轻 量 的 。 

1> Henry8 = #{ class => king, born => 1491, died => 1547 }. 

#{ born => 1491, class=> king, died => 1547 }. 

2> #{ born => B } = Henry8. 

#{ born => 1491, class=> king, died => 1547 }. 

3> B. 

1491 

4> #{ D => 1547 }. 

* 4: variable 'D' unbound 

我 们 在 第 1 行 创建 了 一 个 包含 享 利 八 世 (Henry VII ) 信息 的 新 映射 组 。 在 第 2 行 里 创建 了 一 
个 模式 来 从 映射 组 提取 关联 born 键 的 值 。 模 式 匹 配 成 功 后 ，shell 打 印 出 整个 映射 组 的 值 。 在 第 3 
行 打 印 了 变量 B 的 值 。 

在 第 4 行 里 我 们 试图 找到 一 个 值 为 1547 的 末 知 键 (D )。 但 是 shell 打 印 出 一 个 错误 ， 因 为 映射 
组 里 所 有 的 键 都 必须 是 全 绑 定 的 数据 类 型 ， 而 D 没 有 定义 过 。 

请 注意 ， 上 映射 组 模式 里 键 的 数量 可 能 少 于 所 匹配 映射 组 里 键 的 数量 。 








J 深层 复制 ( deep copy ) 是 指数 据 被 真正 复制 到 了 新 的 内 存 地 址 ， 而 不 是 像 浅 层 复 制 ( shallow copy ) 那样 仅仅 复制 
了 内 存 指针 。 译 者 注 
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可 以 在 函数 的 头 部 使 用 包含 模式 的 映射 组 ,前提 是 映射 组 里 所 有 的 键 都 是 已 知 的 。 举 个 例子 ， 
定义 一 个 count_ characters(Str) 困 数 ， 让 它 返回 一 个 映射 组 ， 内 含 某 个 字符 串 里 各 个 字符 的 
出 现 次 数 。 

count characters(Str) -> 

count characters(Str, #{})., 


count characters([H|IT], #{ H => N }=X) -> 

count characters(T, X#{ H := N+l1 }); 
count characters([H|T], X) -> 

count characters(T, X#{ H => 1 }); 
count characters([], XxX) -> 

X. 


下 面 是 一 个 例子 : 


1> count characters("hello"). 
#{101=>1,104=>1,108=>2,111=>]} 


于 是 我 们 知道 字符 h (ASCI 码 是 101 ) 出 现 了 一 次 ， 以 此 类 推 。count characters/2 有 两 
个 值得 注意 的 地 方 。 子 名 1 里 的 映射 组 内 变量 H 定 义 于 映射 组 之 外 , 因此 是 绑 定 的 (这 是 必需 的 ) 
在 子 句 2 里 ， 我 们 用 map_extend 来 给 映射 组 添加 一 个 新 键 。 


5.3.3 ”操作 映射 组 的 内 置 函 数 
还 有 许多 函数 能 操作 映射 组 ， 它 们 是 maps 模 块 的 一 部 分 。 











@ Rs -> #1{} 


返回 一 个 新 的 空 映射 组 。 


@ erlang's map(M) -> bool() 


如 果 M 是 映射 组 就 返回 true， 和 否则 返回 faLse。 它 可 以 用 在 关卡 测试 或 函数 主体 中 。 


@ mapsito list(M) -> [{K1,V1},..., {Kn,Vn}] 
把 映射 组 M 里 的 所 有 键 和 值 转换 成 一 个 键 值 列 表 。 键 在 生成 的 列表 里 严格 按 升 序 排列 。 


@ maps:from list([{K1,V1},,.., {Kn,Vn}]) -> M 
把 一 个 包含 键 值 对 的 列表 转换 成 映射 组 M。 如 果 同 样 的 键 不 止 一 次 出 现 ， 就 使 用 列表 里 第 
一 个 键 所 关联 的 值 ， 后 续 的 值 都 会 被 忽略 。 





@ maps:map size(Map) -> NumberOfEntries 


返回 映射 组 里 的 条 目 数量 





@ map5s'I5 key(Key, Map) -> bool() 
如 有 果 映 射 组 包含 一 个 键 为 Key 的 项 就 返回 true， 否 则 返回 faLse。 
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maps:get(Key, Map) -> Val 
返回 映射 组 里 与 Key 关 联 的 值 ， 否 则 抛 出 一 个 异 背 错误 。 


maps:find(Key, Map) -> {ok, Value} | error 
返回 映射 组 里 与 Key 关 联 的 仁 ， 否 则 返回 error。 


maps:keys(Map) -> [Key1….KeyN] 
返回 映射 组 所 含 的 键 列 表 ， 按 升序 排列 。 


@ maps:remove(Key, Mj -> M1 


返回 一 个 新 映射 组 M1， 除 了 键 为 Key 的 项 《如 果 有 的 话 ) 被 移 除外 ， 其 他 与 M 一 致 。 


maps:without([Key1, ..., KeyN], M) -> M1 
返回 一 个 新 映射 组 M1， 它 是 M 的 复制 , 但 移 除 了 币 有 [Key1,... ,KeyN] 列 表 里 这 些 键 的 
元 系 。 


maps:difference( M1, M2) -> M3 
M3 是 M1 的 复制 ， 但 移 除 了 那些 与 M2 里 的 元 素 具 有 相同 键 的 元 素 。 
它 的 行为 类 似 下 面 这 种 定义 : 


maps:difference(M1，M2) -> 
maps:without(maps':Kkeys(M2)，M1) . 








5.3.4 映射 组 排序 

映射 组 在 比较 时 首先 会 比 大 小 ， 然 后 再 按照 键 的 排序 比较 键 和 值 。 

如 果 A 和 B 是 映射 组 ， 那 么 当 maps:size(A) < maps:size(B) 时 A < B。 

如 果 A 和 B 是 大 小 相同 的 映射 组 ， 那么 当 maps:to List(A) < maps:to List(B) 时 A < B。 

举 个 例子 ,A = #{age => 23，person => "jim"} 小 于 B = # {email => "sue@somplace. 
com"，name => "sue"}。 这 是 因为 A 的 最 小 键 (age ) 比 B 的 最 小 键 (email ) 更 小 。 

当 有 映射 组 与 其 他 Erlang 数 据 类 型 相 比较 时 ， 因 为 我 们 认为 映射 组 比 列 表 或 元 组 “更 复杂 ”， 
所 以 映射 组 总 是 会 大 于 列表 或 元 组 。 

映射 组 可 以 通过 io:format 里 的 ~p 选 项 输出 ， 并 用 io: read 或 fite:consutLt 该 取 。 








5.3.5 以 JSON 为 桥梁 
熟悉 JSON 的 该 者 会 注意 到 映射 组 与 JSON 数 据 类 型 之 间 的 相似 性 。 有 两 个 内 置 晒 数 可 以 让 映 
射 组 和 JSON 数 据 相 互 转换 。 


@ mapsito json(Map}) -> BIn 


把 一 个 映射 组 转换 成 二 进 制 型 ， 它 包含 用 JSON 表 示 的 该 映射 组 。 二 进 制 型 会 在 第 7 章 中 展 
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开 讨 论 。 请 注意 ， 不 是 所 有 的 映射 组 都 能 转换 成 JSON 数 据 类 型 。 映 射 组 里 所 有 的 值 都 必 
须 是 能 用 JSON 表 示 的 对 象 。 例 如 ， 值 不 能 包含 的 对 象 有 fun、 进 程 标识 竺 和 引用 等 。 如 采 
有 任何 的 键 或 值 不 能 用 JSON 表 示 ，maps :to_json 就 会 失败 。 


@ maps:from json(BIm -> Map 


把 一 个 包含 JSON 数 据 的 二 进 制 型 转换 成 映射 组 。 


@ maps:safe from json(Bim -> Map 
把 一 个 包含 JSON 数 据 的 二 进 制 型 转换 成 映射 组 -Bin 里 的 任何 原子 必须 在 调用 此 内 置 咀 数 
前 就 已 存在 , 否则 就 会 抛 出 一 个 异 党 错误。 这样 做 是 为 了 防止 创建 大 量 的 新 原子 。 出 于 效 
率 的 原因 ，Erlang 不 会 垃圾 回收 ( garbage collect ) 原子 , 所 以 连续 不 断 地 添加 新 原子 会 (在 
很 长 一 段 时 间 后 ) 让 Erlang 虚 拟 机 毅 溃 。 

上 面 两 种 定义 里 的 Map 都 必须 是 json_map() 类 型 的 实例 , 它 的 定义 如 下 《类 型 的 定义 会 在 第 

9 昔 中 介绍 ): 
-type json map() = [{json key(), json value()}]. 
其 中 : 


-type json key() = 
atom() | binary() | io list() 


并 且 : 


-type json value() = 
integer() | binary() | float() | atom() | [json value(})] | json map() 


JSON 对 象 与 Erlang 值 的 映射 关系 如 下 。 

口 JSON 的 数字 用 Erlang 的 整数 或 浮 点 数 表示 。 

口 JSON 的 字符 串 用 Erlang 的 二 进 制 型 表示 。 

口 JSON 的 列表 用 Erlang 的 列表 表示 。 

口 JSON 的 true 和 false 用 Erlang 的 原子 true 和 faLse 表 示 。 

DJSON 的 对 象 用 Erlang 的 映射 组 表示 ， 但 是 有 限制 : 映射 组 里 的 键 必 须 是 原子 、 字 符 串 或 

二 进 制 型 ， 而 值 必须 可 以 用 JSON 的 数据 类 型 表示 。 

当 来 回转 换 JSON 数 据 类 型 时 , 应 当 注 意 一 些 特 定 的 转换 限制 。Erlang 对 整数 提供 了 无 限 的 精 
度 。 所 以 ，Erlang 会 很 自然 地 把 映 冉 组 里 的 某 个 大 数 转 换 成 JSON 数 据 里 的 大 数 ， 而 解码 此 JSON 
数据 的 程序 不 一 定 能 理解 它 。 

在 第 18 章 ， 你 会 了 解 如 何 结合 使 用 映射 组 、JSON 数 据 和 WebSocket， 实 现 一 种 与 在 Web 服 务 
希 内 运行 的 程序 进行 通信 的 价 单 方法 。 

到 目前 为 止 ， 我 们 已 经 介绍 了 Erlang 里 所 有 创建 复合 数据 结构 的 方法 。 我 们 知道 了 列表 是 放 
置 可 变数 量 项 目的 容 融 ,而 元 组 是 放置 固定 数量 项 目的 容 融 。 记 录 的 作用 是 给 元 组 里 的 各 个 元 系 
添加 符号 名 称 ， 上 映射 组 则 被 当 作 关联 数组 使 用 。 
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下 一 和 草 将 介绍 错误 处 理 。 在 此 之 后 , 我 们 会 回 到 顺序 编程 上 来 , 然后 介绍 尚未 提 太 的 二 进 制 
型 和 位 语法 。 


5.4 练习 


(1) 配置 文件 可 以 很 方便 地 用 JSON 数 据 表示 。 请 编写 一 些 函 数 来 读 取 包含 JSON 数 据 的 配置 
文件 , 并 将 它们 转换 成 Erlang 的 映射 组 。 再 编写 一 些 代 人 码 ,对 配置 文件 里 的 数据 进行 合理 性 检查 。 

(2) 编写 一 个 map_search_pred(Map，Pred) 国 数 ， 让 它 返 回 映射 组 里 第 一 个 符合 条 件 的 
{Key, Value} 元 素 ( 条 件 是 Pred (Key，Value) 为 true )。 

(3) 高 级 练习 : 查找 Ruby 散 列 类 的 手册 页 。 制 作 一 个 模块 ， 加 入 这 个 Ruby 类 里 你 认为 适合 
Erlang 的 方法 。 























Erlang 最 初 被 设计 用 来 编写 容错 式 系 统 ， 这 种 系统 原则 上 应 该 永 不 俘 软 。 这 就 意味 春运 行 时 
的 错误 处 理 是 至 天 重要 的 。 在 Erlang 里 ， 我 们 会 非常 严肃 地 对 待 错误 处 理 。 当 错误 发 生 时 ， 需 要 
发 现 并 纠正 它 ， 然 后 继续 。 

常见 的 Erlang 应 用 程序 是 由 儿 十 到 几 百 万 个 并 发 进程 组 成 的 。 拥 有 大 量 进程 改变 了 我 们 对 错 
误 处 理 的 看 法 。 在 只 有 一 个 进程 的 顺序 编程 语言 里 , 关键 的 一 点 是 不 能 让 这 个 进程 月 尝 。 但 如 果 
有 了 大 量 的 进程 ,单个 进程 的 骨 尝 就 不 那么 重要 了 ,前 提 是 其 他 某 些 进程 能 察觉 这 个 朋 沉 ,并 接 
手 角 演进 程 原本 应 该 做 的 事情 。 

要 构建 真正 容错 的 系统 , 我 们 需要 不 止 一 合计 算 机 : 毕 苋 , 骨 演 的 可 能 是 整 台 计算 机 。 因 此， 
故障 检测 和 在 别处 重启 计算 这 个 概念 必须 扩展 到 联网 的 计算 机 上 。 

要 完全 理解 错误 处 理 , 必须 完了 解 顺序 程序 里 的 错误 处 理 , 理解 之 后 再 来 看 如 何 处 理 大 量 并 
行进 程 里 的 错误 。 这 一 章 讨 论 的 是 前 者 。 人 处理 并 发 进程 里 的 错误 由 第 13 革 负责 ,而 构建 一 组 合作 
纠正 错误 的 进程 则 是 23.5 区 的 主题 。 


6.1 处理 顺序 代码 里 的 错误 


每 当 我 们 在 Erlang 里 调用 某 个 浮 数 后 , 下 面 两 件 事 中 的 一 件 就 会 发 生 : 函数 或 者 返回 一 个 值 ， 
或 者 出 现 了 问题 。 我 们 在 上 一 半 里 见 过 这 种 例子 。 还 记得 cost 函 数 吗 ? 


shop.erl 

































































cost (oranges) > 
cost(newspaper) -> 
cost(apples) -> 
( > 
( > 


~ ON Oo On 


cost (pears) 
cost (milk) 


运行 这 个 函数 会 发 生 以 下 情况 : 
1> shop:cost(apples)., 

2 

2> shop:cost(socks). 


** exception error: no function clause matching 
shop:cost(socks) (shop.erl, line 5) 
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当 我 们 调用 cost(socks) 后 , 程序 骨 沉 了 。 发 生 这 种 情况 的 原因 是 函数 定义 里 没有 任何 一 个 
子 句 能 匹配 调用 的 参数 。 

调用 cost (socks ) 完 全 是 无 稽 之 谈 。 这 个 因数 不 能 返回 任何 合理 的 仁 ， 因 为 袜子 的 价格 未 
被 定义 。 在 这 种 情况 下 ， 系 统 没 有 返回 值 ， 而 是 抛 出 了 一 个 异常 错误 一 一 这 是 “月 沉 ”的 技术 性 
说 法 。 

我 们 不 会 去 尝试 修复 这 个 错误 ,因为 这 是 不 可 能 的 。 我 们 不 知道 袜子 的 价格 ,因此 无 法 返回 
一 个 值 。 应 该 由 cost(socks ) 的 调用 者 来 决定 函数 般 溃 后 该 怎么 处 理 。 

异常 错误 发 生 于 系统 遇 到 内 部 错误 时 ,或 者 通过 在 代码 里 显 式 调用 throw(Exception)、 
exit(Exception) 或 error(Exception) 触 发 。 当 我 们 执行 cost(socks) 时 会 发 生 一 个 模式 匹配 
错误 。 没 有 任何 一 个 子 句 定义 了 谍 子 的 价格 ， 所 以 系统 会 月 动 生成 一 个 错误 。 

会 触发 异 肖 错误 的 典型 内 部 错误 有 模式 匹配 错误 (没有 一 个 函数 子 句 能 成 功 匹 配 )， 用 错误 
类 型 的 参数 调用 内 置 兄 数 ( 比如 用 一 个 整数 作为 参数 调用 atom_to_List ), 以 及 用 带 有 错误 值 的 
参数 调用 内 置 函 数 ( 比如 试图 计 某 个 数字 除 以 0 )。 











注意 ”许多 编程 语言 建议 你 应 该 做 防御 式 编程 ( defensive programming ) 并 检查 所 有 函数 的 参数 。 
而 在 Erlang 里 ， 防 御 式 编程 是 内 建 的 。 在 描述 函数 的 行为 时 应 该 只 考虑 合法 的 输入 参数 ， 
其 他 所 有 参数 都 将 导致 内 部 错误 并 自动 被 检测 到 。 永远 不 能 让 函数 对 非法 的 参数 返回 值 ， 
而 是 应 该 抛 出 一 个 异常 错误 。 这 条 规则 被 称 为 “ 任 其 衣 溃 ”。 


可 以 通过 调用 下 面 的 茶 个 内 置 函数 来 显 式 生成 一 个 错误 。 


@ exit(Why) 
当 你 确实 想 要 终止 当前 进程 时 就 用 它 。 如 果 这 个 异常 错误 没有 人 被 捕捉 到 ， 信 号 {'EXIT'， 
Pid,Why} 就 会 被 广播 给 当前 进程 链接 的 所 有 进程 。 我 们 还 没有 遇 到 过 信号 , 在 13.3 节 里 会 
进行 详细 讨论 。 信 号 和 错误 消息 非常 相似 ， 但 在 这 里 只 是 点 到 为 止 。 


@ throw(Why) 
这 个 函数 的 作用 是 抛 出 一 个 调用 者 可 能 想 要 捕捉 的 寞 向 错误 。 在 这 种 情况 下 , 我 们 注 明 了 
被 调用 函数 可 能 会 抛 出 这 个 异常 错误 。 有 两 种 方法 可 以 代替 它 使 用 : 可 以 为 通常 的 情形 编 
写 代码 并 是 有 意 忽略 异常 错误 , 也 可 以 把 调用 封装 在 一 个 try.. .catch 表 达 式 里 , 然后 对 
错误 进行 处 理 。 























@ error(Why) 
这 个 函数 的 作用 是 指示 “ 朋 浊 性 错误 ”， 也 就 是 调用 者 没有 准备 好 处 理 的 非常 严重 的 问题 。 
它 与 系统 内 部 生成 的 销 误 差不多 。 
Erlang 有 两 种 方法 来 捕捉 异 党 错误。 第 一 种 是 把 抛 出 异常 错误 的 调用 水 数 封 痰 在 一 个 
try...catch 表 达 式 里 ， 为 一 种 是 把 调用 封 竣 在 一 个 catch 表 达 式 里 。 
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6.2 用 try.,.catch 捕捉 异常 错 i 


如 采 你 束 悉 Java， 理 解 try.., .catch 表 达 式 就 不 会 有 任何 问题 。Java 可 以 用 以 下 语法 捕捉 异 
党 错误。 


try 1 
block 

} catch (exception type identifier) { 
btock 

} catch (exception type identifier) { 
biock 

Fe 

finally { 
biock 





} 
Erlang 有 一 个 非常 相似 的 结构 ， 看 起 来 就 像 这 样 : 


try FuncOrExpressionSeq of 
Pattern1l [when Guardl] -> Expressions]l; 
Pattern2 [when Guard2] -> Expressions2; 





catch 
ExceptionTypel: ExPatternl1 [when ExGuardl] -> ExExpressionsl,; 
ExceptionType2: ExPattern2 [when ExGuard2] -> ExExpressions2; 


after 
AfterExpressions 
end 


6.2.1 try...catch 具 有 一 个 值 


请 记 住 ，Erlang 里 的 一 切 都 是 表达 式 ， 而 表达 式 都 具有 值 。 之 前 在 “if 表达 式 ” 里 提 到 过 这 
一 点 ,当时 讨论 的 是 为 什么 if 表 达 式 没有 else 部 分 ,这 就 意味 着 try. . .end 这 个 表达 式 也 具有 一 
个 值 。 因 此 ， 我 们 可 以 编写 这 样 的 代码 : 





f( ) -> 
X= try ... end, 
Y = 9g(X), 


更 多 情况 下 ， 并 不 需要 try.. .catch 表 达 式 的 值 。 所 以 只 需要 这 样 写 : 
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请 注意 try.. ,catch 表 达 式 和 case 表 达 式 之 间 的 相似 性 。 


case Expression of 
Patternl [when Guardl] -> Expressions]l; 
Pattern2 [when Guard2j -> Expressions2; 


end 


try.. .catch 就 像 是 case 表 达 式 的 强化 版 。 它 基本 上 就 是 case 表 达 式 加 上 最 后 的 catch 和 
after 区 块 。 

try...catch 的 工作 方式 如 下 : 首先 执行 Func0rExpessionSeq。 如 果 执 行 过 程 没 有 抛 出 异 
第 错误 ， 那 么 孔 数 的 返回 值 就 会 与 Pattern1 (以 及 可 选 的 关卡 Guard1 )、Pattern2 等 模式 进行 
匹配 ， 直 到 匹配 成 功 。 如 果 能 匹配 ,那么 整个 try. , .catch 的 值 就 通过 执行 匹配 模式 之 后 的 表达 
式 序 列 得 出 。 

如 有 果 Func0rExpressionSeq 在 执行 中 抛 出 了 异常 错误 , 那么 ExPattern1 等 捕捉 模式 就 会 与 
它 进 行 匹配 , 找 出 应 该 执行 哪 一 段 表 达 式 序列 .ExceptionType 是 一 个 原子 (throw、exit 和 error 
其 中 之 一 )， 它 告诉 我 们 异 稼 错误 是 如 何 生成 的 。 如 果 省 略 了 ExceptionType， 就 会 使 用 默认 仁 


th row。 





注意 ”Erlang 运 行 时 系统 所 检测 到 的 内 部 错误 总 是 带 有 error 标 签 。 





关键 字 after 之 后 的 代码 是 用 来 在 Func0rExpressionSeq 结 束 后 执行 清理 的 。 这 段 代码 一 定 
会 被 执行 ， 哪 怕 有 异常 错误 抛 出 也 是 如 此 。after 区 块 的 代码 会 在 try 或 catch 区 块 里 的 
Expressions 代 码 完 成 后 立即 运行 。AfterExpressions 的 返回 值 会 被 丢弃 。 

如 采 你 来 目 Ruby， 所 有 这 一 切 看 起 来 应 该 十 分 鸣 悉 。 在 Ruby 里 编写 的 代码 风格 与 之 类 似 。 


begin 








rescue 
ensure 
end 


关键 字 有 所 不 同 ， 但 它们 的 行为 是 相似 的 。 





6.2.2 ”简写 法 


可 以 省 略 try.. .catch 表 达 式 的 多 个 部 分 。 这 段 代码 : 


try F 
catch 


end 
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就 等 于 这 一 上段: 


try F of 
Val -> Val 
catch 


end 


除 此 之 外 ，after 部 分 也 可 以 省 略 。 


6.2.3 try,...catch 编 程 样 例 


设计 应 用 程序 时 , 如 琳 某 段 代 码 的 作用 是 捕捉 错误 , 那么 通 第 会 设法 确保 它 能 捕捉 到 消 数 可 
能 生成 的 一 切 错 误 。 

下 面 这 两 个 函数 对 此 进行 了 演示 。 第 一 个 函数 会 生成 三 种 不 同类 型 的 寞 第 错误 , 并 有 两 个 稼 
规 的 返回 值 。 








try_test.erl 

generate exception(1) -> a; 

generate exception(2) -> throw(a),; 
generate exception(3) -> exit(a); 
generate exception(4) -> {'EXIT', a}; 
generate exception(5) -> error(a). 


现在 编写 一 个 封装 函数 ， 用 它 在 一 个 try.., .catch 表 达 式 里 调用 generate exception。 


try_test.erl 


demol1() -> 
[catcher(I) || I <- [1,2,3,4,5]]. 


catcher(N) -> 
try generate exception(N) of 
Val -> {N, normal, Val} 
catch 
throw:X -> {N, caught, thrown, X}; 
exit:X -> {N, caught, exited, X}; 
error:X -> {N, caught, error, X} 
end, 
运行 它 会 市 来 以 下 结 
> try test:demol(). 
[{1,normal,al}, 
{2,caught, thrown,a}, 
{3,caught,exited,a}, 
{4,normal,{'EXIT' ,a}}, 
{5,caught,error,al}] 


它 展 示 了 捕捉 与 区 分 一 个 函数 所 能 抛 出 的 所 有 噶 第 错误 形式 。 
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6.3 用 catch 抽 捉 异 吊 错误 


男 一 种 捕捉 异常 错误 的 方法 是 使 用 基本 语法 catch。catch 语 法 和 try.. .catch 里 的 catch 
区 块 不 是 一 回 事 ( 这 是 因为 catch 语 句 早 在 try...catch 被 引入 之 前 就 已 经 是 Erlang 语 言 的 一 部 
I 关 

寞 津 错误 如 采 发 生 在 catch 语 句 里 ， 就 会 被 转换 成 一 个 描述 此 错误 的 {'EXIT'，...} 元 组 。 
要 演示 这 一 点 ， 可 以 在 一 个 catch 表 达 式 里 调用 generate exception。 











try_test.erl 
demo2() -> 
[{I, (catch generate exception(1)})} || I <- [1,2,3,4,5]]. 
运行 它 会 市 来 以 下 结 来 : 
2> try_ test:demo2(). 
[41,a}, 
{2,a}, 


{3,{'EXIT' ,a}}, 
{4,{'EXIT' ,a}}, 
{5, {'EXIT', 
{a,[{try test,generate exception,1, 
[{file,"try test.erl"}, {line,9}]}}, 
{try test,' -demo2/0-lc$^0/1-0-',1, 
[{file,"try test.erl"}, {line,28}]}, 
{try test,'-demo2/0-lc$ 0/1-0-',1, 
[{file,"try test.ertl"},{tine,28}]}, 
{erl eval,do apply,6, [{file, "erl eval.erl"},{\line,5/6}]}, 
{shell,exprs,7,|[{file,"shell.erl"},{\line,668}]}, 
{shell,eval exprs,7,[{file," shell .erl"},+{line,623}]}, 
{shell,eval loop,3, [{file,"shell.erl"},{line,608}]}]}}}] 


如 果 你 将 此 输出 与 try.. .catch 一 节 里 的 相 比 ,就 会 发 现 这 两 种 方法 提供 了 不 同 量 级 的 调试 
言 息 。 第 一 种 方法 概括 了 信息 ， 第 二 种 则 提供 了 详细 的 栈 跟踪 信息 。 
6.4 ”针对 异常 错误 的 编程 样式 


处 理 异 利 错 误 不 是 什么 高 精 尖 技术 , 下 面 几 方 包含 了 一 些 第 见 的 代码 模式 , 我 们 可 以 在 日 己 
的 程序 里 借鉴 它们 。 











6.4.1 改进 错误 消息 
内 置 函 数 error/1 的 一 种 用 途 是 改进 错误 消息 的 质量 。 如 果 在 调用 math:sqrt(X) 时 提供 一 
个 负 值 的 参数 ， 就 会 发 生 下 面 的 情况 : 


1> math:sqrt(-1). 
** exception error: bad argument in an arithmetic expression 
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in function math:sqrt/1 
called as math:sqrt(-1) 


可 以 为 其 编 与 一 个 封 痛 困 数 来 改进 错误 消息 。 


lib_misc.erl 


sqrt(X) when X<0 -> 
error({squareRootNegatjveArgument, X}); 
sqrt(X) -> 
math:sqrt(X). 


2> lib misc:sqrt(-1). 
** exception error: {squareRootNegativeArgument,-1} 
in function lib misc:sqrt/l 


6.4.2 ”经 名 返回 销 误 时 的 代码 


如 果 你 的 困 数 并 没有 什么 " 通 篆 的 情形 ” ,那么 多 半 应 该 返回 {fok, Value} 或 {error, Reason} 
这 类 值 ， 但 是 请 记 住 ， 这 将 迫使 所 有 的 调用 者 必须 对 返回 值 做 点 什么 。 然 后 必须 二 选 一 ， 一 种 是 6 
这 么 写 











dT 


case f(xX) of 
{ok, Val} -> 
do_some thing with'(Val); 


{error, Why} -> 


%% ,,， 处理 这 个 错误 ，.， 
end, 


这 样 两 种 返回 值 痢 会 被 处 理 。 万 一 种 是 这 人 么 与 : 





{ok, Val} = f(X), 
do_ some thing with'(Val); 


这 样 ， 如 果 f(X) 返 回 {error，...} 就 会 执 出 一 个 异 营 错误 。 


6.4.3 ”错误 可 能 有 但 罕见 时 的 代码 
这 种 情况 下 ， 通 音 要 编写 能 处 理 错误 的 代码 ， 就 像 这 个 例子 一 样 : 


try my _ func(xX) 
catch 
throw: {thisError, X} -> ,., 
throw:{someOtherError, X} -> ... 
end 


同时 ， 检 测 错误 的 代码 也 应 该 汕 有 匹配 的 throw， 束 像 下 面 这 样 : 
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my_func(X) -> 
case ..., of 


. throw({thisError, ...}) 


. throw({someOQtherError, ...}) 


焉 
Hi 


6.4.4 捕捉 一 切 可 能 的 异 
如 果 想 要 捕捉 一 切 可 能 的 错误 ， 就 可 以 使 用 下 面 的 句 式 ( 基于 能 匹配 一 切 事物 这 条 规则 ): 





try Expr 
catch 
_! -> .,， 处 理 所 有 异常 错误 的 代码 ..， 
end 
如 果 在 代码 里 漏 写 了 标签 : 
try Expr 
catch 
-> ,,， 处 理 所 有 异常 错误 的 代码 .,， 
end 


就 不 会 捕捉 到 所 有 的 错误 ， 因 为 在 这 种 情形 下 系统 会 假设 标签 是 默认 的 throw。 


6.5 枝 跟 踩 


捕捉 到 一 个 异常 错误 后 ， 可 以 调用 erlang:get stacktrace() 来 找到 最 近 的 栈 跟踪 信息 。 


try_test.erl 


demo3() -> 
try generate exception'(5) 
catch 
error:X -> 
{Xx, erlang:get stacktrace()} 





end, 


1> try_test:demo3(). 

{a,[{try test,generate exception,1, [{file,"try test.erl"},1{line,9}]}, 
{try test,demo3,0,[{file,"try test.erl"},{line,33}]}, 
{erl eval,do apply,6,[{file,"erl eval.erl"},{line,5S76}]}, 
{shell,exprs,7, [{file,"shell.erl"},{line,668}]}, 
{shell,eval exprs,7/,[{file,"shell.erl"},{line,623}]}, 
{shell,eval loop,3,|[+{file,"shell.erl"},1{line,608}]}]} 


上 面 的 跟踪 信息 展示 了 试图 执行 try test:demo3() 时 发 生 了 什么 。 它 表明 程序 在 
generate _ exception/1L 王 数 中 前 溃 ， 而 该 旺 数 是 在 try_ test.erl 文 件 的 第 9 行 里 定义 的 。 
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栈 跟 踊 还 包含 了 当前 (已 骨 演 的 ) 函数 如 果 执 行 成 功 会 返回 何 处 的 信息 。 栈 跟 踊 里 的 各 个 元 
组 都 是 {Mod,Func,Arity,Info} 这 种 形式 。Mod、Func 和 Arity 指 明了 某 个 函数 ，Info 则 包含 了 
栈 跟 踊 里 这 一 项 的 文件 名 和 行 号 。 

因此 ，try_test:generate exception/1 本 应 该 返回 try_test:demo3()， 而 后 者 本 应 该 
返回 erl eval:do apply/6， 以 此 类 推 。 如 果 某 个 函数 在 表达 式 序 列 中 被 调用 ， 那么 调用 位 置 
稍 数 将 要 返回 的 位 置 几 乎 是 一 样 的 。 如 有 果 被 调用 的 函数 是 表达 式 序列 的 最 后 一 个 函数 , 那么 此 
喘 数 的 调用 位 置信 息 不 会 保留 在 栈 上 。Erlang 会 对 这 一 类 代码 进行 尾 调 用 优化 ( last-call 
optimization )， 因 此 栈 跟踪 信息 不 会 记录 函数 被 调用 时 的 位 置 ， 只 会 记录 它 将 要 返回 的 位 置 。 

分 析 栈 跟踪 信息 能 让 我 们 很 好 地 判断 出 错误 发 生 时 程序 的 执行 位 置 。 通 浓 栈 跟踪 信息 的 头 两 
条 就 足以 让 你 找到 错误 发 生 的 位 置 了 。 

现在 , 我 们 了 解 了 顺序 程序 里 的 错误 处 理 。 要 牢记 的 一 个 重点 是 任 其 前 溃 。 永 远 不 要 在 晒 数 
被 错误 参数 调用 时 返回 一 个 值 ， 而 是 要 抛 出 一 个 异常 错误 。 要 假定 调用 者 会 修复 这 个 错误 。 


6.6 ” 擅 错 要 快 而 明显 ， 也 要 文明 


为 错误 编写 代码 时 需要 考虑 两 个 关键 原则 第 一 ,应 该 在 错误 发 生 时 立即 将 它 抛 出 , 而 且 要 
抛 得 明显 。 有 些 编程 语言 采用 静默 出 错 的 原则 ,尝试 修复 错误 并 继续 运行 ,这 会 导致 代码 调试 起 
来 异常 困难 。 而 在 Erlang 里 ， 当 系统 内 部 或 程序 逻辑 检测 出 错误 时 ， 正 确 的 做 法 是 立即 崩溃 并 生 
成 一 段 有 意义 的 错误 消息 。 立即 崩溃 是 为 了 不 让 事情 变 得 更 糟 。 错误 消息 应 当 被 写 人 永久 性 的 错 
误 日 志 ， 而 且 要 包含 足够 多 的 细节 ， 以 便 过 后 查 明 是 哪里 出 了 错 。 

第 二 , 文明 抛 错 的 意思 是 只 有 程序 员 才 应 该 能 看 到 程序 崩溃 时 产生 的 详细 错误 消息 。 程序 的 
用 户 绝对 不 能 看 到 这 些 消息 。 另 一 方面 ， 用 户 应 当 得 到 警告 ， 让 他 们 知道 有 错误 发 生 这 一 情况 ， 
以 及 可 以 采取 什么 措施 来 弥补 错误 。 

错误 消息 对 程序 员 来 说 就 像 是 来 之 不 易 的 砂 金 。 绝 不 能 任 由 它们 随 着 屏幕 滚动 而 永远 消失 。 
它们 应 当 被 保存 到 一 个 永久 性 的 日 志文 件 里 ， 以 供 日 后 阅读 。 

到 目前 为 止 ， 我 们 只 涉及 了 顺序 程序 里 的 错误 。 第 13 章 将 介绍 如 何 管理 并 发 程序 里 的 错误 ， 
而 在 23.2 节 里 ， 我 们 将 了 解 如 何 永久 性 记录 错误 日 志 ， 以 使 它们 不 会 丢失 。 

下 一 章 将 介绍 二 进 制 型 和 位 语法 。 位 语法 是 Erlang 所 独 有 的 ， 它 将 模式 匹配 扩展 到 了 位 字段 
(bit field ) 上 ， 让 编写 操作 二 进 制 数据 的 程序 变 得 更 简单 。 


6.7 练习 


(1) file:read file(File) 会 返回 {ok, Bin} 或 者 {error, Why}, 其 中 File 是 文件 名 , Bin 
则 包含 了 文件 的 内 容 。 请 编写 一 个 myfile:read(File) 气 数 ， 当 文件 可 读 取 时 返回 Bin， 否则 抛 
出 一 个 异 和 党 错误 。 

(2) 重 写 try_test.erl 里 的 代码 , 让 它 生 成 两 条 错误 消息 : 一 条 文明 的 消息 给 用 户 ， 另 一 条 
详细 的 消息 给 开发 者 。 
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二 进 制 型 (binary ) 是 一 种 数据 绪 构 ， 它 被 设计 成 用 一 种 节省 空间 的 方式 来 保存 大 批量 的 原 
始 数据 。Erlang 虚 拟 机 对 二 进 制 型 的 输入 、 输 出 和 消息 传递 都 做 了 优化 ， 十 分 高 将。 

如 有 果 要 保存 大 批量 的 无 结构 数据 内 容 , 二进制 型 应 当 是 首选 ,比如 大 型 字符 串 或 文件 的 内 容 。 

在 大 多 数 情 况 下 ， 二 进 制 型 里 的 位 数 都 会 是 8 的 整数 倍 ， 因 此 对 应 一 个 字 市 串 。 如 果 位 数 不 
是 8 的 整数 倍 ， 就 称 这 段 数 据 为 位 串 〈bitstring )。 所 以 当 我 们 说 位 串 时 ， 是 在 强调 数据 里 的 位 数 
不 是 8 的 整数 信 。 

把 二 进 制 型 、 位 串 和 位 级 模式 匹配 引入 Erlang 是 为 了 何 化 网 络 编程 ， 因 为 我 们 通常 希望 深入 
探索 协议 包 里 的 位 级 和 字 闻 级 结构 。 

在 这 一 章 里 , 首先 将 详细 介绍 二 进 制 型 。 二 进 制 型 上 的 大 多 数 操作 同样 适用 于 位 串 , 因此 在 
理解 二 进 制 型 之 后 ， 会 重点 介绍 位 串 与 二 进 制 型 的 不 同 之 处 。 




















7.1 二 进 制 型 


二 进 制 型 的 编写 和 打印 形式 是 双 小 于 号 与 双 大 于 号 之 间 的 一 列 整数 或 字符 串 。 这 里 有 一 个 
例子 : 

了 > <<5,10,20>>. 

<<5 ,10, 20>> 

2> <<"hello">>. 

<<"hello'">> 

3> <<65,66,67>> 

<<"ABC">> 

在 二 进 制 型 里 使 用 整数 时 ， 它们 必须 属于 9 至 255 这 个 范围 。 二 进 制 型 <<"cat">> 是 
<<99,97,116>> 的 简写 形式 ， 也 就 是 说 ， 这 个 二 进 制 型 是 由 字符 串 里 这 些 学 符 的 ASCII 编 码 组 
成 的 。 

和 字符 串 类 似 ,， 如果 某 个 二 进 制 型 的 内 容 是 可 打印 的 字符 串 ，shell 束 会 将 这 个 二 进 制 型 打印 
成 字符 串 ， 否 则 就 打印 成 一 列 整数 。 

可 以 用 内 置 函 数 来 构建 二 进 制 型 或 提取 它 里 面 的 元 素 ， 也 可 以 使 用 位 语法 ( 参见 7.2 节 ), 在 
这 一 方 里 ,我 们 将 只 关注 操作 二 进 制 型 的 内 置 函数 。 




















操作 二 进 制 型 


可 以 用 内 置 函数 来 操作 二 进 制 型 ， 也 可 以 使 用 binary 模 块 里 的 函数 。binary 里 导出 的 许多 
函数 都 是 以 本 地 代码 的 形式 实现 的 。 以 下 是 其 中 最 重要 的 一 些 。 








@ list to binary(L} ->B 
List to binary 返 回 一 个 二 进 制 型 , 它 是 通过 把 io 列 表 (iolist )L 里 的 所 有 元 素 压 遍 后 形 
成 的 ( 压 扁 的 意思 是 移 除 列表 里 所 有 的 插 号 )。io 列 表 本 里 是 循环 定义 的 ， 它 是 指 一 个 列 
表 所 包含 的 元 素 是 90. .255 的 整数 、 二 进 制 型 或 者 其 他 io 列表 。 


1> BlIn1 = <<]1,2,3>>. 








<<] ,2 ，3>> 

2> Bin2 = <<4,5>>. 
<<4,5>> 

3> Bin3 = <<6>>. 
<<b>> 


4> list to binary( [Bin],1,[2,3,B1in2] ,4|Bin3]). 
<<1,2,3,1,2,3,4,5,4,6>> 


注意 ”第 1 行 等 号 两 边 的 空白 是 必需 的 。 如 果 没 有 空白 ，Erlang 的 分 词 器 就 会 把 第 二 个 符 
号 看 作 是 原子 =<， 即 小 于 等 于 操作 符 。 有 时 候 必须 在 二 进 制 型 数据 的 周转 加 上 空 
白 或 括号 来 避免 语法 错误 。 





@ split binary(Bin, Pos) -> {Bin1, Bin2} 
这 个 为 数 在 Pos 处 把 二 进 制 型 Bin 一 分 为 二 。 


1> split binary(<<1,2,3,4,5,6,7,8,9,19>>，3) . 
{<<1,2,3>>,<<4,5,6,7,8,9,10>>} 


@ term to binary(Term) -> BIn 
这 个 函数 能 把 任何 Erlang 数 据 类 型 转换 成 一 个 二 进 制 型 。 
term to_binary 生 成 的 二 进 制 型 使 用 了 所 谓 的 外 部 数据 格式 〈external term format )。 数 
据 类 型 通过 term_to_binary 转 换 成 二 进 制 型 后 可 以 被 保存 在 文件 里 ， 作 为 消息 通过 网 络 
发 送 , 等 等 , 而 转换 前 的 初始 数据 类 型 可 以 在 稍 后 重建 对 于 在 文件 里 保存 复杂 数据 结构 ， 
或 者 癌 远 程 机 需 发 送 复杂 数据 结构 而 言 ， 这 是 极其 有 用 的 。 








@ binary to term(Bin) -> Term 
这 是 term to_binary 的 逆向 函数 。 


1> B = term to binary({binaries,"are”, useful}). 
<<131,104,3,100,0,8,98,105,110,97,114,105,101,11}5,107, 
0,3,97,114,101,100,0,6,117,115,101,102,117,108>> 

2> binary to term(B). 

{binaries, "are" ,USefuUL 
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@ byte Size(Bin) -> Size 
这 个 函数 返回 二 进 制 型 里 的 字 节 数 。 


1> byte size(<<],2,3,4,5>>). 
5 


在 所 有 这 些 函 数 里 ，term to binary 和 binary to term 无 疑 是 我 的 最 爱 。 它 们 非常 有 用 。 
term to_binary 可 以 把 任何 数据 类 型 转换 成 一 个 二 进 制 型 。 在 这 个 二 进 制 型 的 内 部 ( 如 果 舌 视 
一 下 )， 你 会 发 现 用 “Erlang 外 部 数据 格式 ”( 在 Erlang 文 档 里 有 定义 ”) 保存 的 数据 。 一 旦 把 某 个 
数据 类 型 转换 成 二 进 制 型 ,就 可 以 把 它 作 为 消息 通过 套 接 字 发 送出 去 , 或 者 保存 在 文件 里 。 这 是 
实现 分 布 式 Erlang 系 统 的 基本 方法 ， 也 在 许多 数据 库 内 部 使 用 。 














7.2 位 语法 


位 语法 是 一 种 表示 法 , 用 于 从 二 进 制 数 据 里 提取 或 加 入 单独 的 位 或 者 位 串 。 当 你 编写 底层 代 
码 ， 以 位 为 单位 打包 和 解 包 二 进 制 数据 时 ， 就 会 发 现 位 语法 是 极其 有 用 的 。 开 发 位 语法 是 为 了 进 
行 协议 编程 (这 是 Erlang 的 强项 )， 以 及 生成 操作 二 进 制 数据 的 高 将 代码 。 

假设 要 把 三 个 变量 (X、Y 和 Zz ) 打包 进 一 个 16 位 的 内 存 区 域 。X 应 当 在 结果 里 占据 3 位 ，Y 应 
当 占 据 7 位 ， 而 Z 应 当 占 据 6 位 。 在 大 多 数 语 言 里 这 意味 着 要 进行 一 些 麻 烦 的 确 层 操作 ， 包 括 位 移 
位 (bit shifting ) 和 位 掩 码 (bit masking )。 而 在 Erlang 里 ， 只 需要 这 么 写 : 



































M = <<X:3, Y:7, 2:'6>> 


这 段 代 码 会 创建 一 个 二 进 制 型 并 把 它 保存 在 变量 M 里 。 请 注意 : M 的 类 型 是 pinary， 因 为 数 
据 的 总 长 度 是 16 位 ， 可 以 被 8 整除 。 如 果 换 一 种 写法 ， 把 X 的 大 小 改 成 2 位 :: 


M = <<X:2, Y:7, 27:6>> 


那么 M 的 总 位 数 是 15， 因 此 最 终 数 据 结 构 的 类 型 是 bitstring。 

完整 的 位 语法 要 略微 复杂 一 些 , 所 以 我 们 会 一 步 步 加 以 介绍 。 背 先 , 通过 一 些 傈 单 的 代码 来 
看 看 如 何 打包 和 解 包 16 位 字 长 的 RGB 颜色 数据 。 然 后 ,深入 位 霹 法 表达 式 的 细 和 。 最 后 ， 展 示 三 
个 使 用 位 语法 的 代码 示例 ， 它 们 来 源 于 真实 的 程序 。 


7.2.1 打包 和 人 解 包 16 位 颜色 
我 们 将 从 一 个 非常 简单 的 例子 开始 。 假设 想 要 表示 一 种 16 位 RGB 颜色 。 我 们 决定 给 红色 通道 
分 配 $ 位 ， 绿 色 通 道 分 配 6 位 ， 剩 下 的 5 位 则 分 配给 蓝 色 通道 。( 让 绿色 通道 多 使 用 1 位 是 因为 人 眼 


对 绿 光 更 敏感 。) 
可 以 创建 一 个 16 位 的 内 存 区 域 Mem， 让 它 包 含 单 组 RGB 值 ， 就 像 下 面 这 样 : 








GD http://erlang.org/doc/apps/erts/erl ext dist.html 
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1> Red = 2， 

2 

2> Green = 61. 

61 

3> Blue = 20， 

20 

4> Mem = <<Red:5, Green:6, Blue:S>>. 
<<23,180>> 


请 注意 ， 我 们 在 表达 式 4 里 创建 了 一 个 包含 16 位 数据 的 双 字 节 二 进 制 型 。shell 将 它 打 印 为 
<<23 ,180>>。 

要 打包 这 段 内 存 ， 只 需 写 下 表达 式 <<Red:5，Green:6，BLue:5>>。 

要 把 这 个 二 进 制 型 解 包 成 整数 变量 R1、61 和 B1， 可 以 编写 一 个 模式 。 

5> <<R1:5, G1:6, Bl:5>> = Mem. 


<<23,180>> 
6> R1. 











7> G1. 


8> Bl. 








这 真 的 很 简单 。 不 妨 试 疹 用 你 最 辟 欢 的 编程 语言 里 的 位 移 位 和 逻辑 and/or 来 实现 它 。 
实际 上 , 用 位 语法 能 做 的 比 这 个 简单 例子 所 展示 的 要 多 得 多 , 但 首 移 需要 和 擎 握 一 套 相 当 复杂 
的 语法 。 一 旦 做 到 了 ， 就 能 编写 特别 简短 的 代码 来 打包 和 解 包 复杂 的 二 进 制 数据 结构 了 。 


7.2.2 ”位 语法 表达 式 
位 语法 表达 式 被 用 来 构建 二 进 制 型 或 位 串 。 它 们 的 形式 如 下 : 


> 
<<El, E2, ,,,., EnN>> 


每 个 Ei 元 素 都 标识 出 二 进 制 型 或 位 串 里 的 一 个 片段 。 单 个 Ei 元 素 可 以 有 4 种 形式 。 


Ei = Value | 
Value:Size | 
Value/TypeSpecifierList | 
Value:Size/TypeSpecifierList 


如 果 表 达 式 的 总 位 数 是 8 的 整数 倍 ， 就 会 构建 一 个 二 进 制 型 ， 否 则 构建 一 个 位 串 。 

当 你 构建 二 进 制 型 时 ，Value 必 须 是 已 绑 定 变量 、 字 符 串 ,或 是 能 得 出 整数 、 浮 点 数 或 二 进 
制 型 的 表达 式 。 当 它 被 用 于 模式 匹配 操作 时 ，VatLue 可 以 是 绑 定 或 未 绑 定 的 变量 、 整 数 、 字 符 串 、 
浮 点 数 或 二 进 制 型 。 

Size 必 须 是 一 个 能 够 得 出 整数 的 表达 式 。 在 模式 匹配 里 ，Size 必 须 是 一 个 整数 ， 或 者 是 值 
为 整数 的 已 绑 定 变量 。 如 果 Size 在 模式 里 所 处 的 位 置 需要 有 一 个 值 , 它 就 必须 是 已 绑 定 变量 。 二 
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进 制 型 里 茶 个 Size 的 值 可 以 通过 之 前 的 模式 匹配 获得 。 例 如 ， 下 面 的 模式 : 
<<S1lze:4, Data:Ssize/binary, ...>> 


是 个 合法 的 模式 ， 因 为 Size 的 值 已 经 由 二 进 制 型 的 前 四 位 解 包 获 得 ， 然 后 被 用 于 指明 二 进 
制 型 内 下 一 个 片段 的 大 小 。 

Size 的 值 指明 了 片段 的 大 小 。 它 的 默认 值 取决 于 不 同 的 数据 类 型 ， 对 整数 来 说 是 8， 浮 点 数 
则 是 64, 如 果 是 二 进 制 型 就 是 该 二 进 制 型 的 大 小 。 在 模式 匹配 里 , 默认 值 只 对 最 后 那个 元 素 有 效 。 
如 果 未 指定 片段 的 大 小 ， 就 会 采用 默认 值 。 

TypeSpecifierList (类 型 指定 列表 ) 是 一 个 用 连 字 符 分 隔 的 列表 ， 形 式 为 End-Sign- 
Type-Unit。 前 面 这 些 项 中 的 任何 一 个 都 可 以 被 省 略 ， 各 个 项 也 可 以 按 任意 顺序 排列 。 如 果 省 略 
了 某 一 项 ， 系 统 就 会 使 用 它 的 默认 值 。 

类 型 指定 列表 里 的 各 项 可 以 有 如 下 这 些 值 。 

















@ End 可 以 是 big | little | native 
它 指定 机 需 的 字 节 顺序 。native 是 指 在 运行 时 根据 机 需 的 CPU 来 确定 。 默 认 值 是 big,， 也 
就 是 网 络 字 节 顺 序 ( network byte order )。 这 一 项 只 和 从 二 进 制 型 里 打包 和 人 解 包 整 数 与 浮 
点 数 有 关 。 当 你 在 不 同 凶 市 顺序 的 机 益 上 打包 和 人 解 包 二 进 制 型 里 的 整数 时 , 应 当 注 意 设 置 








正确 的 凶 市 顺序 。 
编写 位 语法 表达 式 时 , 可 能 有 必要 先 做 些 试验 ,为 了 确定 目 己 没有 弄 错 , 你 可 以 尝试 下 面 
的 jshell 命 令 ，: 


1> {<<16#12345678:32/big>>,<<16#12345678:32/1ittle>>， 
<<16#12345678:32/native>>,<<16#12345678:32>>}. 
{<<18,52,86,120>>,<<]120,86,52,18>>, 
<<120,86,52,18>>,<<18,52,86,120>>} 


输出 结果 展示 了 位 语法 是 如 何 把 整数 打包 进 二 进 制 型 的 。 

如 果 你 还 是 不 放心 ，term to binary 和 binary to term 可 以 帮 你 搞定 打包 和 解 包 整 数 
的 工作 。 因 此 ， 你 可 以 在 高 位 优先 (big-endian ) 的 机 需 上 创建 一 个 包含 整数 的 元 组 ， 然 
后 用 term_to_binary 把 它 转 换 成 二 进 制 型 并 发 送 至 低位 优先 〈little-endian ) 的 机 融 。 最 
后 , 在 低位 优先 的 机 器 上 运行 binary to term, 这 样 元 组 里 所 有 整数 的 值 都 会 是 正确 的 。 














@ Sign 可 以 是 signed|unsigned 
这 个 参数 只 用 于 模式 匹配 。 默 认 值 是 unsigned。 

@ Type 可 以 是 integer|fLoat|binary|bytes|bitstringlbits|utf8|utf16|utf32 
默认 值 是 integer。 


@ Unit 的 写法 起 unit:1|2|..256 
integer、float 和 bitstring 的 Unit 默 认 值 是 1，binary 则 是 8。utf8、utf16 和 utf32 
类 型 无 需 提 供 信 。 
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个 片段 的 总 长 度 是 Size x Unit 字 节 。binary 类 型 的 片段 长 度 必 须 是 8 的 整数 倍 。 
如 有 条 你 觉得 位 语法 的 描述 有 点 令 人 生长 , 别 春 急 。 正 确 设置 位 语法 的 模式 可 能 会 很 难 。 最 好 
的 办 法 是 在 shell 里 试验 你 和 需要 的 模式 下 到 能 用 为 止 , 然后 再 把 结 灯 复制 粘贴 到 你 的 程序 里 。 我 就 
是 这 人 么 做 的 。 


7.2.3 位 语法 的 真实 例子 


学 习 位 语法 需要 一 点 额外 的 努力 , 但 是 它 种 来 的 好 处 是 巨大 的 。 这 一 节 里 有 三 个 来 源 于 现实 
生活 的 例子 。 所 有 这 些 代码 都 是 从 真实 的 程序 中 剪 切 复制 而 来 的 。 

第 一 个 例子 是 寻找 MPEG 首 频数 据 里 的 同步 点 。 这 个 例子 展示 了 位 语法 模式 匹配 的 威力 。 它 
的 代码 非常 容易 理解 ， 与 MPEG 涉 帧 规范 的 对 应 关系 很 清晰 。 第 二 个 例子 是 构建 微软 通用 对 象 文 
件 格 式 (Microsoft Common Object File Format， 人 简称 COFF ) 的 二 进 制 数据 文件 。 打 包 和 和 解 包 二 
进 制 数据 文件 〈 例 如 COFF ) 的 典型 做 法 是 使 用 二 进 制 型 和 二 进 制 模式 匹配 。 最 后 的 例子 展示 了 
如 何 解 包 一 个 IPv4 数 据 报 ( datagram )。 

1. 寻找 MPEG 数 据 里 的 同步 帧 

假设 要 编写 一 个 操作 MPEG 音 频数 据 的 程序 ， 比 如 一 个 用 Erlang 编 写 的 流 媒体 服务 右 ， 或 者 
提取 摘 述 某 个 MPEG 音 频 流 内 容 的 数据 标签 。 要 做 到 这 一 点 ， 需 要 识别 并 同步 某 个 MPEG 流 的 数 
据 帧 。 

MPEG 音 频数 据 是 由 许多 的 帧 组 成 的 。 每 一 帧 都 有 它 目 己 的 帧 头 ， 后 面 跟着 音频 信息 。 由 于 
没有 文件 头 ， 所 以 原则 上 可 以 把 一 个 MPEG 文 件 切 成 多 个 户 段 ， 而 每 一 段 都 可 以 独立 播放 。 任 何 
读 取 MPEG 流 的 软件 都 应 当 能 找到 头巾， 然后 同步 MPEG 数 据 。 

MPEG 头 以 一 段 11 位 的 帧 同步 〈frame sync ) 信息 开头 ， 它 包含 11 个 连续 的 1 位 ， 后 面 跟 独 描 
述 后 续 数 据 的 信息 : 


AAAAAAAA AAABBCCD EEEEFFoH IIJJKLMM 



































44444444444 同步 字 (11 位 ， 全 部 为 1) 
BB 2 位 的 MPEG 音 频 版 本 ID 
CC 2 位 的 层 描述 

D 这 1 位 是 保护 位 


这 些 位 的 准确 含义 不 是 我 们 的 关注 点 。 基 本 上 ， 只 要 知道 了 从 A 到 M 的 值 ， 就 能 计算 出 一 个 
MPEG 帧 的 总 长 度 。 

为 了 找到 同步 点 ， 首 先 假设 我 们 成 功 定 位 到 了 某 个 MPEG 头 的 起 始 位 置 ， 然 后 试 着 计算 该 帧 
的 长 度 。 之 后 可 能 会 发 生 以 下 某 一 种 情况 。 

口 假设 正确 ， 因 此 当 辐 前 跳 过 帧 长 后 ， 会 找到 另 一 个 MPEG 头 。 

口 假设 错误 。 可 能 没有 定位 到 标记 MPEG 头 起 始 位 置 的 位 序列 〈 由 11 个 连续 的 1 组 成 ) 上 ， 
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或 者 因为 字 的 格式 不 正确 而 无 法 计算 帧 长 。 

D 假设 错误 , 但 定位 到 的 奉 干 字 节 音乐 数据 磁 巧 和 MPEG 头 的 起 始 位 置 很 相似 。 在 这 种 情况 
下 ， 可 以 计算 帧 长 ， 但 是 当 回 前 路 过 这 段 距离 后 ， 我 们 无 法 找到 新 的 MPEG 头 。 

为 了 确保 万 无 一 失 ， 我 们 将 寻找 三 个 连续 的 MPEG 头 。 同 步 的 程序 如 下 所 示 : 


mp3_sync.erl 














find sync(Bin, N) -> 
case is header(N, Bin) of 
{ok, Lenl, } -> 
case is header(N + Lenl, Bin) of 
{ok, Len2, } -> 
case 15s header(N + Lenl + Len2, Bin) of 


{ok, a _} -> 
{ok, N}; 
error -> 
find sync(Bin, N+1) 
end; 
error -> 
find sync(Bin, N+1) 
end ; 
error -> 


find sync(Bin，N+1) 
end . 


find_ sync 答 试 寻 找 三 个 连续 的 MPEG 头 帧 。 如 东 Bin 的 第 N 个 字 节 是 采 个 头 帧 的 开头 ， 
is header(N，Bin) 就 会 返回 {ok，Length，Info}y。 如 果 is header 返 回 了 error， 那 么 N 指 回 
的 就 不 是 正确 的 帧 头 。 

可 以 在 shell 里 做 个 快速 测试 来 确保 这 段 代 码 能 

1> Cl(mp3 sync). 

{ok, mp3_sync} 

2> {ok, Bin} = file:read file("/home/joe/music/mymusic.mp3"). 

{ok, <<73,68,51,3,0,0,0,0,33,22,84,73,84,50,0,0,0,28, ...>> 


3> mp3_sync:find sync(Bin, 1). 
{ok,4256} 


这 里 使 用 了 file:read_file 来 把 整个 文件 读 取 到 一 个 二 进 制 型 中 (参见 16.2.4 方 )。 现 在 来 
写 is header: 

mp3_sync.erl 

ls header(N, Bin) -> 


unpack header(get word(N, Bin)). 


get word(N, Bin) -> 
{_,<<C:4/binary, /binary>>} = split binary (Bin, N), 
C. 
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unpack header (X) -> 
try decode header (Xx) 
catch 
_ -> error 
end. 


这 段 代 码 稍微 复杂 一 些 。 首 先 ， 提 取 32 位 数据 进行 分 析 ( 由 get_word 实 现 )， 然 后 用 
decode_header 解 包 帧 头 。 0 让 decode_header 在 参数 不 是 帧 头 的 开头 时 朋 溃 ( 通 
过 调用 exit/1 实 现 )。 为 了 捕捉 任何 可 能 的 错误 ， 在 一 个 try.. .catch 语 句 里 对 decode_header 
进行 调用 ( 更 多 信息 请 参阅 6.1 方 )。 它 还 会 捕捉 到 任何 由 framelength/4 里 的 错误 代码 所 导致 的 
潜在 错误 。decode header 是 最 精彩 的 部 分 。 











mp3_sync.erl 
decode header (<<2#1111111111]1:11,B:2,C:2, D:1,E:4,F:2,6G:1,Bits:9>>) -> 
Vsn = case B of 
0 -> {2,5}; 
1 -> exit (badVsn); 
2 -> 2; 
3 -> 1 
end, 
Layer = case C of 
0 -> exit (badLayer); 
] -> 3; 
2 -> 2; 
3 -> 1 





end, 
%% Protection = DD, 
BitRate = bitrate(Vsn, Layer, E) * 1000， 
SampleRate = samplerate(Vsn, F), 
Padding = 
FrameLength = framelength(Layer, BitRate, SampleRate, Padding), 
if 
FrameLength < 21 -> 
exit {frameSize); 
true -> 
{ok, FrameLength, {Layer,BitRate,SampleRate,Vsn,Bits}} 
end ; 
decode header( ) -> 
exit (badHeader). 


秘诀 就 在 于 代码 第 一 行 的 这 个 神奇 表达 式 。 

decode header(<<2#11111111111:11,B:2,C:2, D:1,E:4,F:2,6:1,Bits:9>>) -> 

2#11111111111 是 个 二 进 制 整数 ， 因 此 这 个 模式 匹配 11 个 连续 的 1 位 ， 指 派 给 B2 位 ， 指 派 给 
C2 位 ， 以 此 类 推 。 请 注意 ， 这 段 代 码 严格 遵循 之 前 给 出 的 位 级 MPEG 头 规范 。 很 难 再 写 出 比 这 更 


漂亮 和 直接 的 代码 了 。 这 段 代 码 不 但 漂亮 ， 而 且 高 效 。Erlang 编 译 器 会 把 位 语法 模式 转变 成 高 度 
优化 的 代码 ， 用 最 佳 方式 提取 里 面 的 字段 。 
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2. 解 包 COFF 数 据 
几 年 前 我 决定 编写 一 个 程序 来 制作 能 够 在 Windows 中 独立 运行 的 Erlang 程 序 ， 也 就 是 在 任何 
可 运行 Erlang 的 机 融 上 都 能 生成 Windows 可 执行 文件 。 要 做 到 这 一 点 就 需要 理解 和 操作 采用 微软 
通用 对 象 文 件 格 式 (COFF ) 的 文件 。 查找 COFF 的 细节 信息 非常 环 手 , 好 在 有 许多 C++ 程序 的 API 
文档 。C++ 程 序 使 用 的 类 型 声明 有 DWORD、LONG、WORD 和 BYTE， 这 些 类 型 声明 对 于 那些 进行 过 
Windows 内 部 编程 的 程序 员 来 说 并 不 阳 生 。 
文档 对 相关 的 数据 结构 做 了 说 明 ， 但 它 是 从 C 或 C++ 程 序 员 的 视角 编写 的 。 下 面 是 一 个 典型 
的 C 类 型 定义 : 
typedef struct IMAGE RESOURCE DIRECTORY { 
DWORD Characteristics,; 
DWORD TimeDate9tamp ; 
WORD Majorversion， 
WORD Minorversion， 
WORD _ NumberofNamedEntries ; 


WORD NumberOfIdEntries.; 
} IMAGE RESOURCE DIRECTORY, *PIMAGE RESOURCE DIRECTORY; 


为 了 编写 这 个 Erlang 程 序 ， 我 首先 定义 了 4 个 宏 ， 它 们 必须 包括 在 Erlang 源 代码 文件 内 。 


-define (DWORD, 32/unsigned-little-integer). 
-define(LONG, 32/unsigned-little-integer). 
-define(WORD, 16/unsigned-little-integer). 
-define(BYTE, 8/unsigned-little-integer). 








注意 ” 宏 (macro ) 会 在 8.17 节 中 进行 解释 。 要 展开 这 些 宏 ， 需要 使 用 ?DWORD 和 ?LONG 之 类 的 语 
法 。 举 个 例子 ， 宏 ?DWORD 会 展开 成 文本 字面 量 32/Uunsigned-little-integer。 





我 有 童 让 这 些 宏 与 C 里 的 对 应 类 型 具有 相同 的 名 称 。 配 备 了 这 些 宏 之 后 ,我 就 可 以 轻松 编写 
一 些 代码 ， 把 图 像 资 源 数据 解 包 到 二 进 制 型 里 了 。 


unpack image resource directory(Dir) -> 





<<Characteristics : ?DWORD, 
TimeDateStamp : ?DWORD, 
MajorVersion : ?WORD ， 
MinorVersion : ?WORD, 
NumberOfNamedEntries : ?WORD, 
NumberofIdEntries : ?WORD, /binary>> = Dir， 





如 果 对 比 C 和 Erlang 的 代码 ,你 会 发 现 它们 非 第 相似 。 因 此 , 通过 精心 选择 宏 的 名 称 和 Erlang 
代码 的 布局 ， 就 能 最 大 程度 地 缩小 C 代 码 和 Erlang 代 码 之 间 的 语义 鸿沟 ， 这 让 我 们 的 程序 更 容易 
理解 ， 出 错 的 可 能 性 也 会 更 小 。 

下 一 步 是 解 包 Characteristics 里 的 数据 ， 以 此 类 推 。 

Characteristics 是 一 个 32 位 的 学 ， 由 硅 干 标记 组 成 。 用 位 语法 解 包 它 们 极其 简单 ， 只 需 
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要 编写 如 下 代位 : 


<<ImageFileRelocsStripped:1, ImageFileExecutableImage:1, ...>> = 
<<Characteristics:32>> 


代码 <<Characteristics:32>> 把 Characteristics 这 个 整数 转换 成 32 位 的 二 进 制 型 。 接 下 
来 的 代码 再 把 所 需 的 位 解 包 到 ImageFiLeReLocsStripped 和 ImageFiLeExecutabLeImage 这 些 


变量 里 . 





<<ImageFileRelocsStripped:1, ImageFileExecutableImage:l, .,..>> = .., 


我 让 名 称 与 Windows API 里 的 保持 一 致 ， 以 最 大 程度 缩小 规范 和 Erlang 程 序 之 间 的 语义 鸿沟 。 

使 用 这 些 宏 让 解 包 COFF 格 式 的 数据 变 得 一 一 唔 ， 用 简单 一 词 妃 介 不 太 恰 当 ， 但 是 这 段 代 码 
还 是 比较 容易 理解 的 。 

3. 解 包 IPv4 数 据 报头 

这 个 例子 党 示 了 用 单 次 模式 匹配 操作 解析 互联 网 协议 第 4 版 (Internet Protocol version 4， 人 简 
称 IPv4 ) 的 数据 报 。 


-define(IP VERSION, 4). 
-define(IP MIN HDR LEN, 5). 














DgramSize = byte size(Dgram), 
case Dgram of 
<<?IP VERSION:4, HLen:4, SrvcType:8, TotLen:16, 
ID:16, Flags:3, Frag0Off:13, 
TTL:8, Proto:8, HdrCchkSum:16, 
orCIP:32， 
DestIP:32, RestDgram/binary>> when HLen >= 5, 4*HLen =< DgramSize -> 
OptsLen = 4*(HLen - ?IP MIN HDR_ LEN), 
<<DOpts:OptsLen/binary,Data/binary>> = RestDgram, 


这 段 代 码 用 一 个 单独 的 模式 匹配 表达 式 匹 配 了 IP 数 据 报 ,。 这 个 复杂 的 模式 演示 了 如 何 简单 地 
提取 出 不 在 字 节 边界 内 的 数据 ( 比如 ，Flags 和 Frag0ff 字 上 段 的 长 度 分 别 是 3 位 和 13 位 )。 模 式 匹 
配 了 IP 数 据 报 之 后 ， 下 一 次 模式 匹配 操作 会 提取 出 此 数据 报 的 报关 和 数据 部 分 。 

我 们 介绍 了 如 何在 二 进 制 型 上 执行 位 字段 操作 。 再 次 提醒 一 下 ， 二 进 制 型 的 长 度 必须 是 8 位 
的 整数 倍 。 下 一 节 的 主题 是 位 串 ， 它 可 以 用 来 保存 位 的 序列 。 


7.3 位 串 : 处 理 位 级 数据 


对 位 串 (bitstring ) 的 模式 匹配 是 位 级 操作 ， 这 样 我 们 就 能 在 单 次 操作 里 打包 和 解 包 位 的 序 
列 。 这 对 编写 需要 操作 位 级 数据 的 代码 来 说 极其 有 用 ， 例 如 没有 按照 8 位 边界 对 齐 的 数据 或 者 可 
变 长 度数 据 ， 它 们 的 数据 长 度 用 位 而 不 是 字 节 来 表示 。 

可 以 在 shell 里 演示 位 级 处 理 。 
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1> Bl = <<1:8>>， 


<<1>> 

2> byte size(B1). 

1 

3> is blnary(B1) ， 
true 

4> 1s bitstring(B]1). 
true 

5> B2 = <<1:17>>. 
<<0O,0,1:1>> 

6> is binary(B2), 
false 

7> is bitstring(B2). 
true 

8> byte size(B2). 

3 

9> bit size(B2). 

17 


位 级 存储 
在 大 多 数 编程 语言 里 ， 最 小 可 导 址 存储 单元 的 宽度 通常 是 8 位 。 举 个 例子 ， 大 多 数 C 编 译 
器 定义 一 个 char ( 最 小 可 导 址 存储 单元 ) 的 宽度 为 8 位 。 操 作 char 里 的 位 十 分 复杂 ， 因 为 要 单独 
访问 这 些 位 ， 它 们 必须 被 掩 码 并 移 位 到 寄存 器 里 。 编 写 这 类 代码 有 些 困 难 而 且 荔 于 出 错 。 
在 Erlang 里 ， 最 小 可 寻 址 的 存储 单元 是 1 位 ， 位 串 里 各 个 独立 的 位 序列 可 以 直接 访问 ， 无 
需 任何 移 位 和 掩 码 操 作 。 


在 前 面 的 例子 里 ，B1 是 一 个 二 进 制 型 ， 而 B2 是 一 个 位 串 ， 因 为 它 的 长 度 是 17 位 。 我 们 用 语 
法 <<1:17>> 构 建 了 B2， 它 被 打印 成 <<0,0,1:1>>， 也 就 是 说 ， 作 为 一 个 二 进 制 型 字面 量 ， 它 的 
第 三 个 片段 是 一 个 长 度 为 1 的 位 串 。B2 的 位 大 小 是 17， 而 字 节 大 小 是 3 ( 这 是 包含 该 位 串 的 二 进 制 
型 的 实际 大 小 )。 

使 用 位 串 不 是 件 容 易 的 事 。 举 个 例子 ,我们 不 能 把 一 个 位 串 写 入 文件 或 套 接 字 ( 二进制 型 则 
可 以 )， 因 为 文件 和 僚 接 字 使 用 的 单位 是 子 市 。 

下 面 用 一 个 例子 来 结束 本 节 ， 它 会 提取 出 字 节 里 各 个 单独 的 位 。 为 了 做 到 这 一 点 , 我 们 将 使 
用 一 种 新 的 结构 ， 它 被 称 为 位 推导 (bit comprehension )。 位 推导 和 二 进 制 型 的 关系 就 像 列 表 推 导 
和 列表 的 天 系 一 样 。 列 表 推 导 过 有 历 列 表 并 返回 列表 。 位 推导 饥 历 二 进 制 型 并 生成 列表 或 二 进 制 型 。 

这 个 例子 展示 了 如 何 提取 出 字 节 里 的 各 个 位 。 

1> B = <<16#5f>>. 

2> [ X || <<X:1>> <= B]. 

[和 


3> << <<X>> || <<X:1>> <= B >>. 
<<0O,1,0,1,1,1,1,1>> 
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第 1 行 制作 了 一 个 包含 单个 字 闻 的 二 进 制 型 。16#5f 是 一 个 十 六 进 制 的 和 营 量 。shell 把 它 打印 
成 了 <<" ">>， 因 为 16#5f 是 字符 的 ASCI 编 码 。 第 2 行 里 的 语法 <<<X:1>> 是 一 个 模式 ,代表 1 
位 。 它 的 结果 是 一 个 包含 字 市 里 各 个 位 的 列表 。 第 3 行 和 第 2 行 类 似 ， 唯 一 的 区 别 是 我 们 构建 了 一 
个 包含 这 些 位 的 二 进 制 型 ， 而 不 是 列表 。 

位 推导 的 语法 不 会 在 这 里 介绍 ， 你 可 以 在 Erlang 参 考 手册 "里 找到 。 更 多 有 关 位 串 处 理 的 示 
例 可 以 在 论文 Bit-Level Binaries and Generalized Comprehensions in Erlang2 里 找到 。 

现在 我 们 已 经 了 解 了 二 进 制 型 和 位 串 。 每 当 我 们 想 要 管理 大 量 的 无 结构 数据 时 ，Erlang 系 统 
就 会 在 内 部 使 用 二 进 制 型 。 在 后 面 的 儿 草 里 , 我 们 将 看 到 如 何 把 二 进 制 型 作为 消息 通过 套 接 字 发 
送出 去 ， 以 及 如 何 保存 在 文件 里 。 

对 于 顺序 编程 , 我 们 已 经 介绍 的 差不多 了 。 剩 下 的 都 是 一 些 零 散 的 主题 , 没有 什么 特别 重要 
或 令 人 激动 的 , 但 是 了 解 它 们 还 是 很 有 用 的 。 


























7.4 练习 


(1) 编写 一 个 函数 来 反 转 某 个 二 进 制 型 里 的 字 世 顺序 。 

(2) 编写 一 个 term to _ packet(Term) -> Packet 晒 数 ， 通 过 调用 term to binary(Term) 
来 生成 并 返回 一 个 二 进 制 型 ， 它 内 含 长 度 为 4 个 字 市 的 包头 N， 后 跟 N 个 字 市 的 数据 。 

(3) 编写 一 个 反 转 函数 packet_to_term(Packet) -> Term, 使 它 成 为 前 一 个 函数 的 逆 癌 
国 效 。 

(4) 按照 4.1.3 市 的 样式 编写 一 些 测 试 ， 测 一 下 之 前 的 两 个 子 数 是 否 能 正确 地 把 数据 类 型 编码 
成 数据 包 ( packet )， 以 及 通过 解码 数据 包 来 复原 最 初 的 数据 类 型 。 

(5) 编写 一 个 冰 数 来 反 转 某 个 二 进 制 型 所 包含 的 位 。 











GD http://www.erlang.org/doc/reference manual/users guide.html 


@) http://user.it.uu.se/~pergu/papers/erlang05.pdf 








Erlang 顺 友 编 程 仆 天 





Erlang 顺 序 编程 的 剩余 部 分 是 一 些 零 零散 散 的 东西 ， 你 必须 了 解 它们 ， 而 它们 无 法 归 类 于 其 
他 主题 。 这 些 主题 没有 什么 特定 的 顺序 , 为 了 便于 参考 ,我们 将 依照 喘 文 字母 顺序 来 对 它们 进行 
介绍 。 涉 及 的 主题 如 下 。 

D apply 

它 通 过 函数 名 和 参数 计算 该 函数 的 值 ， 其 中 的 函数 名 和 模块 名 是 动态 计算 得 出 的 。 

口 硼 术 表达 式 

这 里 定义 了 所 有 合法 的 算术 表达 式 。 











口 元 数 

一 个 函数 的 元 数 是 这 个 另 数 所 接受 的 参数 数量 。 
口 属性 

这 一 节 涉 及 Erlang 模 块 属性 的 语法 和 解释。 

口 块 表达 式 

它们 是 使 用 begin 和 end 的 表达 式 。 

口 布尔 值 





它们 是 用 原子 true 或 false 表 示 的 事物 。 
口 布尔 表达 式 

这 一 市 介绍 了 所 有 的 布尔 表达 式 。 

口 字符 集 

这 里 介绍 了 Erlang 使 用 的 字符 集 。 

口 注释 

这 一 节 介 绍 了 注释 的 语法 。 

口 动态 代码 载 入 

这 一 市 介绍 了 动态 代码 载 入 的 工作 原理 。 
口 Erlang 的 预 处 理 器 

这 一 节 介 绍 了 Erlang 在 编译 前 发 生 了 什么 。 
口 转 义 序列 

这 一 节 介 绍 了 转 义 序列 的 语法 ， 它 被 用 于 字符 串 和 原子 。 
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口 表达 式 和 表达 式 序列 

这 一 廊 介 绍 了 表达 式 和 表达 式 序 列 是 如 何 定 义 的 。 
口 函数 引用 

这 一 节 介 绍 了 如 何 引 用 函数 。 

口 包含 文件 

这 一 节 介 绍 了 如 何在 编译 时 包含 文件 。 
口 列表 添加 和 移 除 操作 符 
它们 是 ++ 和 --。 

口 安 

这 一 节 介 绍 了 了 Erlang 的 宏 处 理 侨 。 

口 模式 的 匹配 操作 符 

这 一 节 介 绍 了 如 何 将 匹配 操作 符 = 用 在 模式 中 。 

口 数字 

这 一 和 介绍 了 数字 的 霹 法 。 

口 操作 符 优 先 级 

这 一 节 介 绍 了 所 有 Erlang 操 作 符 的 优先 级 和 结合 性 。 

口 进程 字典 

每 个 Erlang 进 程 都 有 一 个 本 地 的 破坏 性 存储 区 域 ， 有 时 候 会 很 有 用 。 

口 引用 

引用 是 独一无二 的 符号 。 

口 短路 布尔 表达 式 

这 些 是 不 完全 求 值 的 布尔 表达 式 。 

口 比较 数据 类 型 

这 一 节 介 绍 了 所 有 的 数据 类 型 比较 操作 符 ， 以 及 各 种 数据 类 型 的 语法 顺 友 。 
口 元 组 模块 

这 是 一 种 创建 “有 状态 ”模块 的 方法 。 

口 下 划 线 变量 

这 些 变 量 会 被 编译 天 特殊 对 符 。 

建议 你 快速 浏览 这 些 主题 ， 不 用 仔细 阅读 它们 。 只 需 有 个 大 概 的 印象 ， 供 以 后 参考 即 可 。 























8.1 apply 

内 置 印 数 apply (Mod，Func，[Argl，Arg2，...，ArgN] ) 会 将 模块 Mod 里 的 Func 世 数 应 用 
到 Argl1，Arg2，..，ArgN 这 些 参数 上 。 它 等 价 于 以 下 调用 : 

Mod:Func(Argl, Arg2, ..., ArgN) 








apply 让 你 能 调用 攻 个 模块 里 的 某 个 消 数 ， 癌 它 传 递 参 数 。 它 与 直接 调用 函数 的 区 别 在 于 模 
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块 名 和 /或 函数 名 可 以 是 动态 计算 得 出 的 。 

所 有 的 Erlang 内 置 国 数 也 可 以 通过 appLy 进 行 调 用 ， 方 法 是 假定 它们 都 属于 erLang 模 块 。 
此 ， 要 构建 一 个 对 内 置 孙 数 的 动态 调用 ， 可 以 编写 以 下 代码 . 


1> apply(erlang, atom to list, [hellol])}). 
"hello" 


警告 应 当 尽 量 避 免 使 用 apply。 当 函 数 的 参数 数量 能 预先 知道 时 , M:F(Argl, Arg2，, ... ArgN) 
这 种 调用 形式 要 比 appLy 好 得 多 。 如 果 使 用 appLy 对 函数 进行 调用 ， 许 多 分 析 工 具 就 无 法 
得 知 发 生 了 什么 ,一 些 特 定 的 编译 器 优化 也 不 能 进行 。 所 以 ,尽量 少 用 appLy， 除 非 绝 对 


appLy 的 Mod 参 数 不 必 非得 是 一 个 原子 ， 也 可 以 是 一 个 元 组 。 如 于 我 们 这 么 调用 : 








{Mod, Pl1l, P2, ..., Pn}:Func(Al, A2, ..., An) 
那么 实际 上 调用 的 是 下 面 这 个 因数 : 
Mod:Func(Al, A2, ..., An, {Mod, Pl1, P2, ..., Pn}) 


这 个 技巧 会 在 24.3 节 中 深入 讨论 。 
算术 表达 式 


下 面 的 表格 展示 了 所 有 可 用 的 算术 表达 式 。 每 种 算术 操作 都 有 1 或 2 个 参数 , 这 些 参 数 在 表格 
里 显示 为 “整数 ”或 “数字 ”( 数 字 的 意思 是 此 参数 可 以 是 整数 或 浮 点 数 )。 


表 3 算术 表达 式 


8.2 














操作 符 描 述 参数 类 型 优先 级 
+ X 十 X 数字 ] 
二 yy, 4 数字 ] 
X*Yy 人 数字 2 
4 X / Y ( 浮 点 除法 ) 数字 2 
bnot X 对 X 执 行 按 位 取 反 (bitwise not) 整数 2 
Xdivy X 被 7 整除 整数 2 
X rem Y X 除 以 7 的 整数 余数 整数 
X band Y 对 X 和 17 执行 按 位 与 (bitwise and) 整数 2 
X+Y X + Y 数字 3 
人 X-Y 数字 3 
X bor Y 对 X 和 Y 执 行 按 位 或 (bitwise or) 整数 3 
X bxor Y 对 X 和 Y 执 行 按 位 异 或 (bitwise xor) 整数 3 
X bslN 把 X 向 左 算术 位 移 (arithmetic bitshift) N 位 整数 3 
X bsr N 把 X 向 右 算术 位 移 N 位 整数 3 
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这 些 操 作 符 相互 之 间 根 据 优先 级 结合 ,一 个 复杂 算术 表达 式 的 求 值 顺 序 由 所 含 操作 符 的 优先 
级 而 定 : 所 有 优先 级 为 1 的 操作 符 会 汉 先 求 值 ， 然 后 轮 到 所 有 优先 级 为 2 的 操作 符 ， 以 此 类 推 。 

可 以 用 括号 来 改变 移 认 的 求 值 顺序 : 括号 内 的 表达 式 会 首 和 匈 求 值 。 优 先 级 相同 的 操作 符 膛 循 
回 左 结合 的 规则 ， 从 左 往 右 分 别 求 但 。 


8.3 ”元 数 


一 个 函数 的 元 数 ( arity ) 是 该 函数 所 拥有 的 参数 数量 。 在 Erlang 里 ， 同 一 模块 里 的 两 个 名 称 
相同 、 元 数 不 同 的 函数 是 完全 不 同 的 函数 。 除 了 碰巧 使 用 同一 个 名 称 外 ， 它 们 之 间 毫 不 相关 。 

根据 惯例 ，Erlang 程 序 员 经 常 将 名 称 相同 、 元 数 不 同 的 函数 作为 辅助 函数 使 用 。 这 里 有 一 个 
例子 : 


lib_misc.erl 























Sum(L) -> sum(L, 0)., 


sum([], N) -> N; 

Sum(t [HIT]，N -> Sum(T，H+N) ， 

你 看 到 的 是 两 个 不 同 的 函数 ， 一 个 元 数 是 1， 为 一 个 元 数 是 2。 

sum(L) 函数 罕 加 列表 L 里 的 所 有 元 系 。 它 用 到 一 个 名 为 sum/2 的 辅助 函数 ,但 也 可 以 是 其 他 
任何 名 称 。 即 便 把 辅助 函数 命名 为 hedgehog/2( 刺 猎 )， 程 序 的 意思 也 不 会 有 任何 变化 。 不 过 ， 
sum/2 是 更 好 的 命名 选择 ， 因 为 它 提示 程序 的 谈 者 这 是 什么 ， 而 且 还 不 必 发 明 一 个 新 名 称 〈 这 总 
是 很 困难 的 )。 

我 们 经 钊 会 通过 不 导出 辅助 郴 数 来 “隐藏 ”它们 。 所 以 , 定义 sum(L) 的 模块 只 会 导出 sum/1， 
而 不 会 导出 sum/2。 


8.4 属性 


模块 属性 的 语法 是 -AtomTag(...)， 它 们 被 用 来 定义 文件 的 某 些 属性 。( 注意 : -record(...) 
和 -include(...) 有 着 类 似 的 语法 ,但 是 不 算 模块 属性 。) 模块 属性 有 两 种 类 型 : 预定 义 型 和 用 
户 定 义 型 。 
8.4.1 预定 义 的 模块 属性 

下 列 模块 属性 有 着 预先 定义 的 含义 ， 必 须 放 置 在 任何 函数 定义 之 前 。 




















@ -module(modname). 
这 是 模块 声明 。 modname 必 须 是 一 个 原子 。 此 属性 必须 是 文件 里 的 第 一 个 属性 。 按照 惯例 ， 
modname 的 代码 应 当 保存 在 名 为 modname ,ertL 的 文件 里 。 如 果 不 这 么 做 ， 自 动 代 码 加 载 就 
不 能 正 浓 工作 。 更 多 细 世 请 参阅 8.10 。 
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@ -import(Mod, [Namel/Arityl, Name2/Arity2,...]). 
import 声 明 列 举 了 哪些 函数 需要 导入 到 模块 中 。 上 面 这 个 声明 的 意思 是 要 从 Mod 模 块 叶 入 
参数 为 Arity1 的 Name1l 孙 数 ， 参 数 为 Arity2 的 Name2 摧 数 ， 等 等 。 

一 旦 从 别 的 模块 里 导 人 了 某 个 函数 ， 调 用 它 的 时 候 就 无 需 指 定 模块 名 了 。 这 里 有 一 个 例子 : 


-module (abc). 
-import(lists, [map/2]). 











f(L) -> 
Ll1 = map(fun(X) -> 2*X end, L), 
lists:sum({(L1). 


调用 map 时 不 需要 限定 模块 名 ， 而 调用 sum 时 需要 把 模块 名 包括 在 函数 调用 内 。 
@ -export([Namel/Arlity1，Name2/Arity2，,., ,|]). 


导出 当前 模块 里 的 Name1/Arityl1 和 Name2/Arity2 等 函数 ,函数 只 有 被 导出 后 才能 在 模块 
之 外 调用 。 这 里 有 一 个 例子 : 


abc.er| 





-module (abc)., 
-export([a/2, b/1]). 


; Y) -> CcC(X) + a(Y)., 
) -> 2 * X, 
) -> X * X., 
= 





其 中 导出 声明 的 意思 是 只 有 a/2 和 b/1 能 在 abc 模 块 之 外 调用 。 因 此 ， 如 果 在 shell 里 (也 就 
是 模块 外 部 ) 调用 abc:a(5) ， 就 会 导致 一 个 错误 ， 因 为 a/1 没 有 从 此 模块 导出 。 

1> abc:a(1,2) . 

7 

2> abc:b(12) ， 

144 

3> abc:a(5). 

** exception error: Undefined function abc:a/l 


这 段 错 误 消 晨 也 许 会 让 人 困惑 。 调 用 abc:a(5) 失 败 的 原因 是 相关 孙 数 未 定义 ， 而 事实 上 
它 在 模块 里 有 和 定义， 只 是 没有 被 导出 。 





@ -Complle(Options)， 
添加 0ptions 到 编译 器 选项 列表 中 。0ptions 可 以 是 单个 编译 器 选项 ， 也 可 以 是 一 个 编译 
途 选 项 列表 ( 选项 的 相关 介绍 可 以 在 compile 模 块 的 手册 页 里 找到 )。 


注意 ”-compile(export all) .这 个 编译 器 选项 经 常会 在 调试 程序 时 用 到 。 它 会 导出 模 
块 里 的 所 有 有 函数 ， 无 需 再 显 式 使 用 -export 标 识 了 。 
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@ -VSn(Verslonj， 
指定 模块 的 版 本 号 。Version 可 以 是 任何 学 面 数 据 类 型 。Version 的 值 没有 什么 特别 的 语 
法 或 含义 ,但 可 以 用 于 分 析 程 序 或 者 作为 说 明文 档 使 用 。 
8.4.2 用户 定 义 的 模块 属性 
用 户 定 义 属性 的 语法 如 下 : 





@ -SomeTag (Value). 
SomeTag 必 须 是 一 个 原子 ， 而 Value 必 须 是 一 个 字面 数据 类 型 。 模 块 属性 的 值 会 被 编译 进 模 
块 ， 可 以 在 运行 时 提取 。 这 个 例子 里 的 模块 包含 了 一 些 用 户 定义 的 属性 : 


attrs.erl 





-module(attrs). 

-vsn(1234). 

-author ({joe,armstrong}). 
-purpose("example of attributes"). 
-export([fac/1]). 


fac(1) -> 1; 
fac(N) -> N * fac(N-1). 


可 以 用 下 面 的 方式 提取 这 些 值 : 


17> attrs:moduLe 1info(). 
[{exports, [{fac,1}, {module info,0},{module info,1}]}, 
{imports, []}, 
{attributes,[{vsn,[1234]1}, 
{author, [{joe,armstrong}]}, 
{purpose,"example of attributes"}]}, 
{compile,[{options, []}, 
{version,"4.8"}, 
{time, {2013,5,3,7,36,55}}, 
{source,"/Users/joe/jaerlang2/code/attrs,.erl"}]1}] 


源 代 码 文 件 所 含 的 用 户 定 义 属性 再 一 次 出 现 了 ， 它 们 表现 为 {attributes，,. ,} 的 下 属 数 
据 类 型 。 元 组 {compile，...} 包 含 了 编译 带 添 加 的 信息 。{version,"4.8"} 这 个 值 是 编 府 带 的 
厂 本 号 ,不 应 与 模块 属性 里 定义 的 vsn 标 签 相 混 消 。 在 上 面 的 例子 里 ，attrs:modutLe_info() 返 
回 一 个 属性 列表 ， 内 含 所 有 与 被 编译 模块 相关 的 元 数据 。attrs:module info(X) (X 可 以 是 
exports、imports、attributes 和 compile 中 的 一 个 ) 会 返回 与 模块 相关 的 单个 属性 。 

请 注意 ， 函 数 moduLe info/0 和 module info/1 会 在 模块 编译 时 自动 创建 。 

要 运行 attrs:module info,， 必须 先 把 attrs 模 块 的 beam 代 码 加 载 到 Erlang 虚 拟 机 里 。 也 可 
以 使 用 beam_Lib 模 块 来 提取 同样 的 信息 ， 这 样 就 不 必 载 人 attrs 模 块 了 。 
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3> beam lib:chunks("attrs.beam",[attributes]). 

{ok, {fattrs, [{attributes, [{author, [{joe,armstrong}]}, 
{purpose, "example of attributes"}, 
{vsn,[1234]}]}]}} 


beam_1lib:chunks 可 以 在 不 载 入 模块 代码 的 情况 下 提取 模块 里 的 属性 数据 。 


8.5 ” 块 表 达 式 
块 表达 式 用 于 以 下 情形 : 代码 某 处 的 Erlang 语 法 要 求 单个 表达 式 ， 但 我 们 想 使 用 一 个 表达 式 








序列 。 举 个 例子 ， 在 一 个 形式 为 [E || .1] 的 列表 推导 中 ， 语 法 要 求 E 是 单个 表达 式 ， 但 我 们 也 
许 想 要 在 E 里 做 不 止 一 件 事 情 。 
begin 
Expr1l, 
ExprN 
end 


你 可 以 用 块 表达 式 归 组 一 个 表达 式 序 列 ， 就 像 子 句 的 主体 一 样 。begin ... end 的 值 就 是 块 
里 最 后 那个 表达 式 的 值 。 


8.6 布尔 值 


Erlang 没 有 单独 的 布尔 值 类 型 。 不 过 原子 true 和 false 具 有 特殊 的 含义 , 可 以 用 来 表示 布尔 值 。 

有 时 候 编 写 的 函数 会 返回 两 个 可 能 的 原子 值 中 的 一 个 。 这 时 , 正确 的 做 法 是 确保 它们 返回 一 
个 布尔 值 。 与 此 同时 ， 让 你 的 函数 名 称 反 映 出 它们 会 返回 布尔 值 也 是 一 个 好 主意 。 

举 个 例子 ,假设 想 编写 一 个 程序 来 表示 某 个 文件 的 状态 , 一 来 二 去 也 许 就 洛 到 一 个 返回 open 
(打开 ) 或 cLosed (关闭 ) 的 fite_state(FitLe) 国 数 身 上 。 编 写 这 个 羡 数 时 ， 可 以 考虑 重 命名 
该 函数 并 让 它 返 回 一 个 布尔 什 。 稍 加 思索 后 ， 我们 可 以 重新 编写 程序 ， 让 一 个 名 为 
is file open(FilLe) 的 因数 返回 true 或 faLse。 

表示 状态 时 用 布尔 值 而 非 另 选 两 个 原子 的 原因 很 简单 .标准 库 里 有 大 量 国 数 作用 于 返回 布尔 
值 的 函数 。 因 此 ， 如 果 确 保 所 有 的 函数 都 返回 布尔 值 ， 就 能 将 它们 用 于 标准 库 也 数 了 。 

举 个 例子 ,假设 有 一 个 文件 列表 L 并 想 把 它 分 成 一 个 打开 文件 列表 和 一 个 关闭 文件 列表 。 可 
以 编写 以 下 代码 来 利用 标准 库 : 


lists:partition(fun is file open/1, L) 
但 如 果 用 的 是 file_state/1 哺 数 ， 佛 怕 就 要 先 编写 一 个 转换 程序 才能 调用 库 方 法 了 。 


lists:partition(fun(X) -> 
case fjile state(X) of 
open -> true,; 
closed -> false 
end, L) 
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8.7 ”布尔 表达 式 


可 用 的 布尔 表达 式 有 四 种 。 

D not Bl1: 风 辑 非 

口 Bl and B2: 逻辑 与 

口 Bl or B2: 逻辑 或 

口 Bl xor B2: 逻辑 异 或 

在 所 有 这 些 表 达 式 里 ，B1 和 B2 都 必须 是 布尔 值 或 者 执行 结果 为 布尔 值 的 表达 式 。 这 里 有 一 
些 例子 : 

1> not true. 

false 

2> true and false. 

false 

3> true or false. 

true 

4> (2 > 1) or (3 > 4). 

true 


8.8 字符 集 


从 Erlang 的 R16B 版 开始 ，Erlang 源 代码 文件 都 假定 采用 UTF-8 字 人 符 集 编码 。 在 这 之 前 用 的 是 
ISO-8859-1 (Latin-l ) 字符 集 。 这 就 意味 着 所 有 UTF-8 可 打印 字符 都 能 在 源 代 码 文件 里 使 用 ， 无 
需 使 用 任何 转 义 序列 。 

Erlang 内 部 没有 字符 数据 类 型 。 字 符 串 其 实 并 不 存在 ， 而 是 由 整数 列表 来 表示 。 用 整数 列表 
表示 Unicode 字 符 串 是 至 无 问题 的 。 























8.9 注释 


Erlang 里 的 注释 从 一 个 百 分 号 字符 (%) 开始 ， 一直 延 伸 到 行 尾 。Erlang 没 有 块 注释 。 





注意 ”在 代码 示例 里 经 党 出 现 两 个 百 分 号 字符 (%% )。 双 百 分 号 标记 能 被 Erlang 模 式 的 Emacs 
编辑 器 识别 ， 并 启动 注释 行 自动 缩 进 功能 。 


和 5 这 是 一 段 注释 
my_function(Argl, Arg2) -> 
case (Argl) of 
{yes, X} -> % 如 果 成 功 
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8.10 动态 代码 载 入 


动态 代码 载 人 是 内 建 于 Erlang 核 心 的 最 怀 人 特性 之 一 。 它 的 美妙 之 处 在 于 你 无 需 了 解 后 台 的 
运作 就 能 顺利 实现 它 。 

它 的 思路 很 简单 : 每 当 调 用 someModule:someFunction(.,,) 时 ,调用 的 总 是 最 新 版 模块 
里 的 最 新 版 函数 ， 哪 怕 当 代码 在 模块 里 运行 时 重新 编译 了 该 模块 也 是 如 此 。 

如 有 果 在 a 循 环 调用 b 时 重新 编译 了 b， 那 么 下 一 次 a 调 用 b 时 就 会 目 动 调用 新 版 的 bp。 如 果 有 许 
多 不 同 进程 正在 运行 而 它们 都 调用 了 b, 那么 当 b 被 重新 编译 后 , 所 有 这 些 进 程 就 都 会 调用 新 版 的 
b。 为 了 了 解 它 的 工作 原理 ， 我 们 将 编写 两 个 小 模块 : a 和 b。b 模 块 非常 简单 。 

b.erl 


-module(b). 
-export( [x/0]). 














Xf() -> 1., 
现在 来 编写 a。 


a.er| 


-module(a). 
-compile(export all). 


start(Tag) -> 
spawn(fun() -> loop(Tag) end). 


loop(Tag) -> 
sleep(), 
Val = b:x(), 
io:format("Vsni (~p) bi:x{() = ~p~n",[Tag, Val]), 
loop(Tag). 


sleep() -> 
receive 
after 3000 -> true 
end. 


现在 可 以 编译 a 和 b， 然 后 启动 两 个 a 进 程 。 


1> cl(b)， 

{ok, b} 

2> c{a}). 

{ok, a} 

3> a:sStart(one). 
< 日 ,41 ,0> 
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ll 
一 


Vsnl (one) b:x() 
4> a:start(two). 
< .43.0> 

Vsnl1 (one) b:x() = 
Vsnl (two) b:x() 
Vsnl (one) b:x() 
Vsnl1 (two) b:x() 


ee ， 然 后 打印 出 结果。 现在 进入 编辑 各， 把 模块 b 改 


-module(b)., 
-export ([x/90]). 


己 己 记 


x() -> 2， 

然后 在 shell 里 重新 编译 b。 这 是 现在 所 发 生 的 : 
5> C(b) ， 

{ok,b} 


Vsnl] {one)} b:x{) 
Vsnl1 (two) b:x() 
Vsnl] (one) b:x() 
Vsnl (two) b:x() 


FJ IJ N ID 


两 个 原版 的 a 仍 然 在 运行 ， 但 现在 它们 调用 了 新 版 的 b。 所 以 ， 在 模块 a 里 调用 b:x() 时 ， 实 
际 上 是 在 调用 “b 的 最 新 版 *。 我 们 可 以 随心 所 欲 地 多 次 修改 并 重新 编译 b， 而 所 有 调用 它 的 模块 BS 
无 需 特别 处 理 就 会 自动 调用 新 版 的 b。 

现在 已 经 重新 编译 了 b ， 那 么 如 果 我 们 修改 并 重新 编译 a 会 发 生 什 么 ? 来 做 个 试验 ， 把 a 改 成 
下 面 这 样 : 

-module(a). 

-compile(export all). 








start(Tag) -> 
spawn(fun() -> loop(Tag) end). 


loop(Tag) -> 
sleep(), 
Val = b:x(), 
jo:format("Vsn2 (~p) bi:x() = ~p~n",l[Tag, Vall]), 
loop(Tag). 


sleep() -> 
receive 
after 3000 -> true 
end. 


现在 编译 并 启动 a。 
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b> c(a). 

{ok,a} 

Vsnl1 (one) b:x() = 2 
Vsnl1 (two) b:x() = 2 


/> a:start(three). 
< 日 .9D3 ,DO> 

Vsnl 
Vsnl 
Vsn2 
Vsnl 
Vsnl 
Vsn2 


Il MMI NN 


2 











有 趣 的 事情 发 生 了 。 启 动 新 版 的 a 后 ， 我 们 看 到 了 新 版 正在 运行 。 但 是 ， 那 些 运 行 最 初版 a 
的 现 有 进程 仍然 在 正常 地 运行 旧版 的 a。 
现在 可 以 试 着 再 次 修改 b。 


-module(b)., 
-export([x/0]). 


x() -> 3， 
我 们 将 在 shell 里 重新 编译 bp。， 观 察 会 发 生 什么 。 


8> Cc(b). 

{ok,b} 

Vsnl (one) b:x() 
Vsnl (two) b:x{() = 
Vsn2 (three) b:x() 


| 《Au Lu 


3 


现在 新 旧版 本 的 a 者 调用 了 b 的 最 新 版 。 
最 后 ， 再 次 修改 a ( 这 是 第 三 次 修改 a 了 )。 


-module(a). 
-compile(export all). 


start(Tag) -> 
spawn(fun() -> loop(Tag) end). 


loop(Tag) -> 
sleep(), 
Val = b:x(), 
ijo:format ("Vsn3 (~p) bi:x() = ~p~n", [Tag, Val]), 
loop(Tag). 


sleep() -> 
receive 
after 3000 -> true 
end. 
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现在 ， 当 我 们 重新 编译 a 并 司 动 一 个 新 版 的 a 时 ， 就 会 看 到 以 下 输出 : 


9> Cf(al)， 
{ok,a} 
Vsn2 (three) b:x() = 3 


10> a'start(four). 
<0 .106.0> 

Vsn2 (three) b:x 
Vsn3 (four) b:x( 
Vsn2 (three) b:x 
Vsn3 (four) b:x( 


) 宇 习 


) = 3 


) 
) = 3 











这 上 段 输出 里 的 字符 串 是 由 两 个 最 新 版 本 的 a ( 第 2 版 和 第 3 版 ) 生成 的 ， 而 那些 运行 第 1 版 a 代 
码 的 进程 已 经 消失 了 。 

在 任 一 时 刻 ，Erlang 人 允许 一 个 模块 的 两 个 版 本 同时 运行 : 当前 版 和 旧版 。 重 新 编译 某 个 模块 
时 ,任何 运行 旧版 代码 的 进程 都 会 被 终止 ， 当 前 版 成 为 旧版 ,新 编译 的 版 本 则 成 为 当前 版 。 可 以 
把 这 想象 成 一 个 市 有 两 个 版 本 代码 的 移 位 寄存 希 。 当 添加 新 代码 时 ， 最 老 的 版 本 就 被 清除 了 。 一 
些 进 程 可 以 运行 旧版 代码 ， 与 此 同时 ， 男 一 些 则 可 以 运行 新 版 代码 。 

更 多 细节 请 参阅 purge_module 的 文档 ”。 


8.11 Erlang 的 预 处 理 器 


Erlang 横 块 在 编 详 前 会 目 动 由 Erlang 的 预 处 理 融 进 行 处 理 。 预 处 理 融会 展开 源 文 件 里 所 有 的 
宏 ， 并 插入 必要 的 包含 文件 。 

通 第 情况 下 ， 无 需 碍 看 预 处 理 融 的 输出 ， 但 在 特定 情形 下 《比如 调试 采 个 有 问题 的 安 时 )， 
应 该 保存 预 处 理 器 的 输出 。 要 查看 some modute.ert 模 块 的 预 处 理 结果 , 可 以 在 操作 系统 的 shell 
里 输入 以 下 命令 。 

$ erlc -P some module,er\ 


这 会 生成 一 个 名 为 some_module.P 的 清单 文件 。 


8.12 ” 转 义 序列 


可 以 在 字符 串 和 带 引 号 的 原子 里 使 用 转 义 序列 来 输入 任何 不 可 打印 的 字符 。 表 4 列 出 了 所 有 
可 用 的 转 义 序列 。 

让 我 们 在 shell 里 举 一 些 例子 来 展示 这 些 约定 方式 是 如 何 工作 的 。( 注意 : 格式 字符 串 里 的 ~w 
是 指 忠实 地 打印 列表 ， 而 不 对 输出 结 末 进行 类 化 。) 




















GD 最 新 链接 为 : http://wwwi.erlang.org/doc/man/erlang.html#purge _ module-1。 
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%5%5 控制 字符 

1> io:format("~w~n", ["\b\d\e\f\n\r\s\t\v"]). 
[8,127,27,12,10,13,32,9,11] 

ok 

%% 字符 串 里 的 八进制 字符 

2> io:format("~w~n", ["\123\12\1"]). 
[83, 10,1] 

ok 

%% 字符 串 里 的 引号 和 反 斜 杠 

3> lio:format("~w~n", ["\'\"\\"]). 
[39,34,92] 

OK 

%% 字符 编码 

4> 1l0o:format("~w~n", ["\a\z\A\Z"]). 
[97 ,122,65,90] 


ok 
表 4 ” 转 义 序列 

转 义 序列 含义 整数 编码 
\b 退 格 符 8 
\d 删除 符 127 
\e 换 码 符 27 
\f 换 页 符 12 
\n 换行 符 10 
\r 回 车 符 13 
\s 空格 符 32 
\t 制 表 符 2 
WV 垂直 制 表 符 11 
Wl 十 六 进 制 字 符 (... 是 十 六 进 制 字符 ) 
\“a..\z 或 \“A..\”Z Ctrlt+A 至 Ctrl+Z 1 至 26 
\ 单 引号 39 
eo 双 引 号 34 
WW 有 反 斜 杠 92 
\C C 的 ASCII 编 码 (C 是 一 个 字符 ) (一 个 整数 ) 


8.13 ”表达 式 和 表达 式 友 列 


在 Erlang 里 ， 任 何 可 以 执行 并 生成 一 个 值 的 事物 都 锌 称 为 表达 式 〈expression )。 这 就 芋 味 看 
catch、if 和 try...catch 这 些 都 是 表达 式 。 而 记录 声明 和 模块 属性 这 些 不 能 被 求 值 ， 所 以 它们 
不 是 表达 趣 。 

表达 式 序列 ( expression sequence ) 是 一 系列 由 去 号 分 隔 的 表达 式 。 它 们 在 -> 箭头 之 后 随处 
可 见 。 表 达 式 序列 E1，E2,,..，En 的 值 被 定义 为 序列 最 后 那个 表达 式 的 什 ， 而 该 表达 式 在 计算 
时 可 以 使 用 E1，E2 等 表达 式 所 创建 的 绑 定 。 它 就 等 价 于 LISP 里 的 progn。 
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8.14 ”函数 引用 
我 们 有 时 想 引 用 在 当前 或 外 部 模块 里 定义 的 某 个 晒 数 ， 可 以 用 下 列 标记 实现 。 








@ funLocalfunc/Arity 


用 于 引用 当前 模块 里 参数 为 Arity 的 本 地 函数 LocalFunc。 








@ fun Mod:RemoteFunc/Arity 
用 于 引用 Mod 模 块 里 参数 为 Arity 的 外 部 疯 数 RemoteFunc。 
这 里 有 一 个 引用 当前 模块 函数 的 例子 : 


-module(x1). 
-export([square/1, ...1]). 











sqUuare(X) -> X * X, 


duublety -> lists:map(fun square/1, L). 
如 果 要 调用 某 个 外 部 模块 里 的 水 数 ， 束 可 以 像 下 面 这 个 例子 一 样 引 用 它 : 


-module (x2). 








double(L) -> lists:map(fun xl:square/1, L). 





fun xl:sdquare/1 指 的 是 x1 模 块 里 的 square/1 函 数 。 
请 注意 ， 包 含 模块 名 的 男 数 引用 提供 了 动态 代码 升级 的 切换 点 。 更 多 细节 请 参阅 8.10 节 。 


8.15 包含 文件 
下 面 的 语法 可 以 用 来 包含 文件 : 











-include (Filename)., 


按照 Erlang 的 惯例 ， 包 含 文件 的 扩展 名 是 .hrL。FiteName 应 当 包 含 一 个 绝对 或 相对 路 径 ， 
使 预 处 理 需 能 找到 正确 的 文件 。 包 含 库 的 头 文件 〈1library header file ) 时 可 以 用 下 面 的 语法 : 

-IncLude Lib(Name) ， 

这 里 有 一 个 例子 : 

-include lib("kernel/include/file.hrti"). 

在 这 种 情况 下 ，Erlang 编 译 带 会 找到 正确 的 包含 文件 。( 前 面 例子 中 的 kernet 是 指定 义 该 头 
文件 的 应 用 。) 

包含 文件 里 经 常会 有 记录 的 定义 。 如 采 许 多 模块 需要 共享 通用 的 记录 定义 , 就 会 把 它们 放 到 
包含 文件 里 ， 再 由 所 有 需要 这 些 定义 的 模块 包含 此 文件 。 
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8.16 ”列表 操作 : ++ 和 - - 


++ 和 - -是 用 于 列表 添加 和 移 除 的 中 绥 操 作 符 。 

A ++ B 使 A 和 B 相 加 (也 就 是 附加 )。 

A -- B 从 列表 A 中 移 除 列表 B。 移 除 的 意思 是 8 中 所 有 元 素 都 会 从 A 里 面 去 除 。 请 注意 :如 果 
符号 X 在 B 里 只 出 现 了 K 次 ， 那 么 A 只 会 移 除 前 K 个 X。 

这 里 有 一 些 例 子 : 

1> [1,2,3] ++ [4,5,6]. 

[1,2,3,4,5,6] 

2> [a,b,c,1,d,e,l,x,y,1] ee [1]. 

[a,b,c,d,e,1,x,y,1] 

3> [a,b,c,l,d,e,l,x,y,1] Se [1,1]. 

[a,b,c,d,e,x,y,1] 

4> [a,b,c,1,d,e,l1,x,y,1] i [1,1,1]. 

[a,b,c,d,e,x,y] 

2> [a,b,c,1,d,e,l,x,y,1] [了 

[a,b,c,d,e,x,y] 


++ 也 可 以 用 在 模式 里 。 在 匹配 字符 串 时 ， 可 以 编写 如 下 模式 : 


f("begin" ++ T) -> ,.. 
f("end" ++ T) -> ，,， 








子 句 1 里 的 模式 会 扩展 成 [$b, $e, $9,$i, $n|T]。 





8.17 宏 


Erlang 的 宏 以 如 下 方式 编写 : 


-define(Constant, Replacement). 
-define(Func(Varl, Var2,.., Var), Replacement). 


当 Erlang 的 预 处 理 器 epp 磁 到 一 个 ?MacroName 形 式 的 表达 式 时 ， 就 会 展开 这 个 宏 。 安 定义 里 
出 现 的 变量 会 匹配 对 应 宏 调 用 位 置 的 完整 形式 。 


-define(macrol(X, Y), {a, X, Y})., 


foo(A) -> 
?macrol{({A+10, b) 


它 展开 后 是 这 样 的 : 


foo(A) -> 
{a,A+10,b}. 


另外 还 有 一 些 预 定义 宏 提 供 了 关于 当前 模块 的 信息 。 列 举 如 下 : 
口 ?FILE 展 开 成 当前 的 文件 名 ; 
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口 ?MODULE 展 开 成 当前 的 模块 名 ; 
口 ?LINE 展 开 成 当前 的 行 号 。 





安 控制 流 
模块 的 内 部 文 持 下 列 指令 ， 可 以 用 它们 来 控制 安 的 展开 。 


@ -undef(Macro). 


取消 宏 的 定义 ， 此 后 就 无 法 调用 这 个 宏 了 了。 





@ -ifdef(Macro). 
仅 当 Macro 有 过 定义 时 才 执 行 后 面 的 代码 。 


@ -fndef(Macro). 


仅 当 Macro 未 被 定义 时 才 执 行 后 面 的 代码 。 


@ -else, 


可 用 于 ifdef 或 ifndef 语 句 之 后 。 如 果 条 件 为 否 ，else 后 面 的 语句 就 会 被 执行 。 


@ -endif. 
标记 ifdef 或 ifndef 语 句 的 结 


条 件 安 必 须 有 恰当 的 能 套 。 按 惯例 它们 被 归 组 如 下 : 





-ifdef (<FLagName>). 
-define(...). 
-else, 
-define(...). 
-end1if. 


我 们 可 以 用 这 些 宏 来 定义 一 个 DEBUG (调试 ) 宏 。 这 里 是 一 个 例子 : 


m1.erl 


-module (m1)., 
-export([Loop/1]). 


-ifdef (debug flag)., 

-define(DEBUG(X), io:format('"DEBUG ~p:~p ~p~n",[?MODULE, ?LINE, Xx])). 
-else. 

-define (DEBUG(X), void). 

-endif. 


loop(0) -> 
done ; 

Loop(N) -> 
?DEBUG(N), 
loop(N-1). 
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注意 io:format(String， [Args]) 会 根据 String 里 的 格式 信息 在 Erlang shell 中 打印 出 
[Args] 所 含 的 变量 。 格 式 编码 用 一 个 ~ 符号 作为 前 级 。~p 是 美化 打印 ( pretty print ) 的 
简称 ，~n 则 会 生成 一 个 新 行 。io:format 能 理解 的 格式 选项 数量 极其 庞大 ,更 多 信息 请 
参见 16.3.1 节 。 





为 了 启用 这 个 宏 , 我 们 在 编译 代码 时 设置 了 debug flag。 具体 做 法 是 给 c/2 添 加 一 个 额外 参 
数 如 下 : 


1> c(ml, {d, debug flag}). 
{ok,ml} 

2> ml:loop(4). 

DEBUG m1:13 4 

DEBUG ml1:13 3 

DEBUG ml:13 2 

DEBUG ml:13 1 

done 


如 宁 没 有 设置 debug_fLag， 这 个 宏 就 只 会 展开 成 原子 void。 选 择 这 个 名 称 没有 什么 实际 意 
义 ， 只 是 用 来 提醒 你 没有 人 会 对 这 个 安 的 值 感 兴趣 。 


8.18 模式 的 匹配 操作 符 


假设 有 如 下 代码 : 


Line1 funcl([{tagl, A, B}|T]) -> 
2 











3 f(..., {tagl, A, B}, ...) 

4 证 

我 们 在 第 1 行 模式 匹配 了 数据 类 型 {tagl1，A，B}， 在 第 3 行 用 参数 {tagl1，A，B} 调 用 了 ff。 

这 么 做 时 ， 系 统 会 重建 数据 类 型 {tagl1，A，B}。 一 种 更 高 效 且 不 易 出 错 的 方式 是 把 这 个 模式 指 
派 给 一 个 临时 变量 Zz-， 人 然后 将 它 传递 给 f， 就 像 这 样 . 


funcl([{tagl, A, B}=Z|T]) -> 








. Pe 


匹配 操作 符 可 以 用 在 模式 里 的 任何 位 置 , 因此 如 果 有 两 个 需要 重建 的 数据 类 型 ， 比如 下 面 代 
码 里 的 : 


funcl([{tag, {one, A}, B}|T]) -> 


f(ans tags {oneyAys Bs sid)s 
glassy {ONG As sv) 
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就 可 以 引入 两 个 新 变量 Z1 和 Z2， 像 下 面 这 样 写 : 
funcl([{tag, {one, A}=Zz1, B}=Z2|T]) -> 


Te 
四 


8.19 ”数字 
Erlang 里 的 数字 不 是 整数 就 是 浮 点 数 。 
8.19.1 整数 
整数 的 运算 是 精确 的 ， 而 且 用 来 表示 整数 的 位 数 只 受 限 于 可 用 的 内 存 。 
整数 可 以 有 三 种 不 同 的 写法 。 
@ 传统 写法 
在 这 里 ， 整 数 的 写法 和 你 预料 的 一 样 。 比 如 ，12、12375 和 -23427 都 是 整数 。 








@ KK 进 制 整 数 

除 10 以 外 的 数字 进 制 整数 使 用 Kk#Digits 这 种 写法 。 因 此 ， 可 以 把 一 个 二 进 制 数 写成 
2#00101010， 或 者 把 一 个 十 六 进 制 数 写 成 16#af6bfa23。 对 大 于 10 的 进 制 而 言 ，abc... 
(或 ABC... ) 这 些 字符 代表 了 数字 10、11 和 12， 以 此 类 推 。 最 高 的 进 制 数 是 36。 





e $ 写法 
$C 这 种 写法 代表 了 ASCII 字 符 C 的 整数 代码 。 因 此 ，$a 是 97 的 简写 , $1 是 49 的 简写 , 以 此 
类 推 。 





还 可 以 紧 挨 着 $ 使 用 表 4 里 描述 的 任意 转 义 序列 。 所 以 ，$\n 是 10，$\^c 是 3， 以 此 类 推 。 
这 里 有 一 些 整 数 的 例子 : 


0 -65 2#010001110 -8#377 16#fe34 16#FE34 36#wow 
它们 的 值 分 别 是 0、-65、142、-255、65076、65076 和 42368。 


8.19.2 ” 浮 点 数 

一 个 浮 点 数 由 五 部 分 组 成 : 一 个 可 选 的 正 负 号 ,一 个 整数 部 分 , 一 个 小 数 点 ,一 个 分 数 部 分 
和 一 个 可 选 的 指数 部 分 。 

这 里 有 一 些 浮 点 数 的 例子 : 


1.0 3.14159 -2.3e+6 23.56E-27 


po 
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解析 后 的 浮 点 数 在 系统 内 部 使 用 IEEE 754 的 64 位 格式 表示 。 绝 对 值 在 10 盖 到 10 范 围 内 的 
实数 可 以 用 Erlang 的 浮上 点 数 表示 。 


8.20 ”操作 付 优 先 级 


表 5 按 照 降 序 的 优先 级 展示 了 所 有 Erlang 操 作 符 和 它们 的 结合 性 。 
于 确定 无 括号 表达 式 的 执行 顺序 。 


操作 符 优 和 完 级 和 结合 性 用 











表 5 操作 符 优先 级 


操 作 符 结 合 性 


(一 元 ) +、 (一 元 ) -、bnot、not 
/~、 *~、 div、rem、band、and 左 结合 
+、-、bor、bxor、bsL、bsr、or、Xor 左 结合 
++、-- 右 结合 
==， /= < < SD= DS =, /= 
andalso 
orelse 
i 右 结合 
catch 








优先 级 更 高 ( 在 表格 更 上 方 ) 的 表达 式 会 首先 执行 ,然后 才 轮 到 优先 级 较 低 的 表达 式 。 举 个 
例子 ， 要 执行 3+4*5+6， 首 先 会 执行 子 表达 式 4*5， 因 为 (*# ) 在 表 中 的 位 置 高 于 (+ )。 现 在 ， 行 
执行 的 表达 陈 变 成 3+20+6。 又 因为 (+ ) 是 一 个 左 结 合 操作 从， 我 们 将 它 解 读 为 (3+20)+6， 所 以 
会 首先 执行 3+20， 得 23， 最 后 青 执行 23+6。 

3+4*5+6 用 完整 的 括号 形式 表现 就 是 ( (3+(4*5))+6)。 和 所 有 编程 语言 一 样 ， 与 其 单纯 依赖 
这 些 优先 级 规则 ， 不 如 用 括号 来 标明 范围 。 


进程 字典 


每 个 Erlang 进 程 都 有 一 个 被 称 为 进程 字典 (process dictionary ) 的 私有 数据 存储 区 域 。 进 程 字 
典 是 一 个 关联 数组 (在 其 他 语言 里 可 能 被 称 作 map 、hashmap 或 者 散 列 表 )， 它 由 知 干 个 键 和 值 组 
成 。 每 个 键 只 有 一 个 值 。 

这 个 字典 可 以 用 下 列 内 置 吨 数 进行 操作 。 








8.21 





@ put(Key, Value) -> OldValue,. 
给 进程 字典 添加 一 个 Key，Vatlue 组 合 。put 的 值 是 0LdValue， 也 就 是 Key 之 前 关联 的 值 。 
如 条 没有 之 前 的 什 ， 就 返回 原子 undefined。 


@ get(Key) -> Value. 
查找 Key 的 值 。 如 果 字 典 里 存在 Key, VaLue 组 合 就 返回 VaLue, 否则 返回 原子 undefined。 


@ get() -> [{Key,Value}]. 
返回 整个 字典 ， 形 式 是 一 个 由 {Key,VaLue} 元 组 所 构成 的 列表 。 





@ get keys(Value) -> [Key]. 
返回 一 个 列表 ， 内 含 字 典 里 所 有 值 为 Value 的 键 。 


@ erase(Key) -> Value， 


返回 Key 的 关联 值 ， 如 果 不 存 在 则 返回 原子 undefined。 最 后 ， 删 除 Key 的 关联 值 。 


@ erase{) -> [{Key,Value}]. 
删除 整个 进程 字典 。 返回 值 是 一 个 由 {Key ,Value} 元 组 所 构成 的 列表 , 代表 了 字典 删除 之 
前 的 状态 。 


这 里 有 一 个 例子 : 
1> erasel(). 

[] 

2> put (x, 20). 
undefined 

3> get (x). 

20 

4> get (y). 
undefined 

5> put(y, 40). 
undefined 

6> get(y). 

40 

7> get(). 
[4y,40}, {x,20}] 
8> erase(x), 

20 

9> get() . 
[{y,40}] 


如 你 所 见 , 进程 字典 里 的 变量 和 命令 式 编程 语言 里 传统 可 变 变 量 的 行为 非 第 相似 。 如 果 使 用 
进程 字典 , 你 的 代码 就 不 再 是 无 副作用 的 了 ,而 且 我 们 在 3.3.1 广 讨论 过 的 所 有 使 用 非 破 坏 性 变量 
的 好 处 也 将 不 复 存在 。 出 于 这 个 原因 ， 应 当 少 用 进程 字典 。 




















注意 我 很 少 使 用 进程 字典 ,进程 字典 可 能 会 给 你 的 程序 引入 不 易 察觉 的 bug, 让 调试 变 得 困难 。 
但 是 有 一 种 用 法 我 是 支持 的 ， 那 就 是 用 进程 字典 来 保存 “一 次 性 写 入 ”的 变量 。 如 果 某 
个 键 一 次 性 获得 一 个 值 而 且 不 会 改变 它 ， 那 么 将 其 保存 在 进程 字典 里 在 茶 些 时 候 还 是 可 
尺 接受 的 。 
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8.22 引用 


引用 (reference ) 是 一 种 全 局 唯一 的 Erlang 数 据 类 型 。 它 们 由 内 置 吨 数 erLang:make_ref() 
创建 。 引 用 的 用 途 是 创建 独一无二 的 标签 ， 把 它 存放 在 数据 里 并 在 后 面 用 于 比较 是 否 相 等 。 举 个 
例子 ，bug 跟 躁 系统 可 以 给 每 个 新 的 bug 报 告 添加 一 个 引用 ， 从 而 赋予 它 一 个 独一无二 的 标识 。 


8.23 ”短路 布尔 表达 式 


短路 布尔 表达 式 ( short-circuit boolean expression ) 是 一 种 只 在 必要 时 才 对 参数 求 值 的 表达 式 。 
“短路 ”布尔 表达 式 有 两 种 。 




















@ EXprl orelse Expr2 
它 会 首先 执行 Expr1。 如 果 Expr1 的 执行 结果 是 true，Expr2 就 不 再 执行 。 如 果 Expr1 的 执 
行 结 果 是 false， 则 会 执行 Expr2。 





@ Exprl andalso Expr2 
它 会 首先 执行 Exprl1。 如 果 Expr1 的 执行 结果 是 true， 则 会 执行 Expr2。 如 果 Expr1 的 执行 
结果 是 false，Expr2 就 不 再 执行 。 





注意 ”在 对 应 的 布尔 表达 式 里 (A or B 和 A and B )， 两 边 的 参数 总 会 被 执行 ， 即 使 表达 式 的 真 
值 只 需要 第 一 个 表达 式 的 值 就 能 确定 也 是 如 此 。 


8.24 ”比较 数据 类 型 
表 6 列 出 了 全 部 8 种 可 用 的 数据 类 型 比较 操作 。 
表 6 ”比较 数据 类 型 








操作 符 售 义 

X > Y 关 大 于 了 

X <Y X 小 于 Y 

X=<Y Xx 等 于 或 小 于 YY 
X>=Y X 大 于 或 等 于 Y 
x = x 等 于 Y 

X/=Y Xx 不 等 于 Y 
ee x 与 Y 完 全 相同 
x =/=Y x 与 Y 不 完全 相同 


为 了 便于 比较 ， 我 们 给 所 有 的 数据 类 型 做 了 全 排序 ( total ordering ) 的 定义 。 定 义 的 结 
如 下 : 
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Number < atom < reference < fun < port < pid < tuple (and record) < map < list < binary 


比如 ,根据 定义 ， 一 个 数字 (任何 数字 ) 小 于 一 个 原子 (任何 原子 )， 而 一 个 元 组 大 于 一 个 
原子 ， 以 此 类 推 。( 请 注意 ， 出 于 排序 的 需要 ， 端 口 和 进程 标识 符 也 被 包括 在 这 个 名 单 里 。) 

有 了 所 有 数据 类 型 的 全 排序 就 意味 看 可 以 对 任何 类 型 的 列表 进行 排序 , 以 及 根据 键 的 排序 顺 
序 构建 高 效 的 数据 访问 方式 。 

所 有 的 数据 类 型 比较 操作 符 ( 除了 =:= 和 =/= ) 在 参数 全 为 数字 时 具有 以 下 行为 。 

口 如 来 一 个 参数 是 整数 而 男 一 个 是 浮 点 数 ， 那 么 整数 会 先 转换 成 浮 点 数 ， 然 后 再 进行 比较 。 

口 如 果 两 个 参数 都 是 整数 或 者 都 是 浮 点 数 ， 就 会 “ 按 原样 ”使 用 ， 也 就 是 不 做 转换 。 

还 应 当 非 常 章 层 地 使 用 == ( 特别 是 对 C 或 Java 程 序 员 而 言 )，100 次 里 有 99 次 应 该 用 的 是 =:=。 
== 只 有 在 比较 浮 点 数 和 整数 时 才 有 用 。=:= 则 是 用 来 测试 两 个 数据 类 型 是 否 完全 相同 。 

完全 相同 的 意思 是 具有 相同 的 值 ( 类 似 Common Lisp 的 EQUAL )。 因 为 值 是 不 可 变 的 ， 所 以 
这 里 不 涉及 任何 指针 标识 。 如 末 不 确定 的 话 ， 就 用 =:=， 见 到 == 时 则 要 三 思 。 请 注意 ， 刚 才 的 注 
解 也 适用 于 /= 和 =/=，/= 的 意思 是 “不 等 于 ”， 而 =/= 的 意思 是 “不 完全 相同 ”。 


















































注意 ”你 会 在 很 多 库 代 码 和 已 发 布 代码 里 看 到 该 用 =:= 的 地 方 用 了 == 操 作 符 。 幸 运 的 是 ,这 类 错 
误 通常 不 会 导致 程序 出 错 ， 因 为 如 果 == 的 参数 不 包含 任何 浮 点 数 的 话 ， 那 么 这 两 个 操作 
符 的 行为 就 是 相同 的 。 





还 应 该 知道 ， 也 数 的 子 句 匹配 总 是 意味 着 精确 的 模式 匹配 ， 所 以 如 果 定 义 了 一 个 fun F = 
fun(12) -> ..，end， 那 么 试图 执行 F(12.0) 就 会 出 错 。 


8.25 ”元 组 模块 











调用 M:f(Argl1，Arg2，...，ArgN) 时 ,我 们 假定 M 是 一 个 模块 名 。 但 M 也 可 以 是 一 个 形式 
为 {Mod1, X1, X2，... Xn} 的 元 组 。 在 这 种 情况 下 ,调用 的 函数 就 是 Mod1:f(Arg1l, Arg2, ...， 
Arg3，M) 。 


这 种 机 制 可 以 用 来 创建 “有 状态 的 模块 ”( 将 在 24.3 市 里 讨论 ) 和 “ 适 配 带 模式 ”( 将 在 24.4 
节 里 讨论 )。 


8.26 下 划 线 变量 


关于 变量 还 有 一 件 事 需 要 说 一 下 。 VarName 这 种 特殊 语法 代表 一 个 常规 变量 ( normal 
variable )， 而 不 是 匿名 变量 。 一 般 来 说 ， 当 某 个 变量 在 子 句 里 只 使 用 了 一 次 时 ， 编 译 需 会 生成 一 
个 警告 ， 因为 这 通常 是 出 错 的 信号 。 但 如 果 这 个 只 用 了 一 次 的 变量 以 下 划 线 开头 ， 就 不 会 有 错误 
消息 。 

因为 Var 是 稼 规 变 量 ， 所 以 如 条 你 忘 了 这 一 点 并 将 它 用 于 “不 关心 ”的 模式 ， 就 可 能 导致 
非常 微妙 的 bug。 举 个 例子 ， 在 一 个 非 稼 复杂 的 模式 匹配 里 ， 也 许 很 难 察 觉 Int 被 多 次 不 恰当 地 
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使 用 ， 从 而 导致 模式 匹配 失败 。 
下 划 线 变量 有 两 种 主要 的 用 途 。 
口 命名 一 个 我 们 不 打算 使 用 的 变量 。 例 如 ， 相 比 open(FiLte， )，open(FiLe， Mode) 这 
种 写法 能 让 程序 的 可 读 性 更 高 。 
口 用 于 调试 。 淮 个 例子 ,假设 编写 如 下 代码 : 
some_func(X) -> 
{P, Q} = Some other func(X), 


io:format("0 = ~p~n", [Q]), 
P, 


编 详 它 不 会 产生 错误 消息 。 
现在 注释 挥 下 面 的 格式 语句 : 
some func(X) -> 
{P, Q} = some other func(X), 


%% io:format("0Q = ~p~n", [0Q]), 
P ， 


如 果 编 译 它 ， 编 译 占 就 会 生成 一 个 变量 Q 未 使 用 的 警告 。 
如 末 把 这 个 郴 数 重 新 编写 如 下 : 
some func(X) -> 

{P, Q} = some other func(X), 


io:format(" 0 = ~p~n", [_Q]), 
Pp. 


就 可 以 注释 挥 格式 场 句 ， 而 编译 融 也 不 会 再 抱怨 了 。 

现在 我 们 真正 完成 了 Erlang 的 顺序 编程 部 分 。 

在 接 下 来 的 两 昔 里 我 们 将 完成 本 书 的 第 二 部 分 。 我 们 会 从 摘 述 Erlang 函 数 类 型 的 类 型 表示 法 
开始 ， 然 后 介绍 一 些 可 以 用 来 对 Erlang 代 三 做 类 型 检查 的 工具 。 该 部 分 的 最 后 一 章 将 介绍 几 种 编 
译 和 运行 程序 的 方法 。 














8.27 练习 


(1) 复习 这 一 章 里 关于 Mod:module info() 的 部 分 。 输 入 命令 dict:module info()。 这 个 
模块 返回 了 多 少 个 也 数 ? 

(2) code:all_loaded() 命 令 会 返回 一 个 由 {Mod,File} 对 构成 的 列表 ， 内 含 所 有 Erlang 系 统 
载 入 的 模块 。 使 用 内 置 函数 Mod:modutLe_info() 了 解 这 些 模块 。 编 写 一 些 闵 数 来 找 出 哪个 模块 
导出 的 函数 最 多 ,以 及 哪个 函数 名 最 第 见 。 编 写 一 个 也 数 来 找 出 所 有 不 市 收 义 的 函数 名 ， 也 就 是 
那些 只 在 一 个 模块 里 出 现 过 的 孔 数 名 。 








Erlang 有 一 种 类 型 表示 法 ， 它 可 以 用 来 定义 新 的 数据 类 型 并 给 代码 添加 类 型 注解 〈type 
annotation )。 类 型 注解 能 让 代码 更 易 理 解 和 维护 ， 还 可 以 在 编译 时 检测 错误 。 

在 这 一 划 里 ,我 们 将 介绍 类 型 表示 法 ， 并 讨论 两 个 可 以 用 来 寻找 代码 错误 的 程序 。 

将 要 讨论 的 这 两 个 程序 名 为 dialyzer 和 typer, 它们 存在 于 标准 Erlang 分 发 套装 里 。dialyzer 
代表 “DIscrepancy AnaLYZer for ERlang programs”( 用 于 Erlang 程 序 的 差错 分 析 需 )， 它 的 作用 名 
副 其 实 : 寻找 Erlang 代 码 里 的 差错 。typer 提 供 了 程序 里 使 用 的 类 型 信息 。dialyzer 和 和 typer 不 需要 
类 型 注解 就 能 完美 工作 ,但 如 果 你 给 程序 添加 了 类 型 注解 ， 这 些 工 具 的 分 析 质 量 就 会 变 得 更 高 。 

这 一 章 比较 复杂 ， 所 以 我 们 将 从 一 个 简单 的 例子 看 手 ， 然 后 次 入 一 些 ， 看 看 类 型 的 语法 。 在 
此 之 后 ， 会 进入 dialyzer 的 教程 ， 讨 论 使 用 dialyzer 时 应 采用 的 工作 流 ， 以 及 dialyzer 无 法 找到 的 错 
误 类 型 。 最 后 ， 通 过 介绍 dialyzer 的 工作 原理 来 更 好 地 理解 它 所 找到 的 错误 。 


9.1 指定 数据 和 函数 类 型 


我 们 即将 开始 一 段 漫长 的 徒步 旅程 , 押运 的 是 有 一 个 模块 可 以 让 我 们 来 规划 一 和 看 。 此 模块 的 
开头 部 分 是 这 样 的 : 





























walks.erl 


-module (walks). 
-export([plan route/2]). 


-Shec plan route(point(), point()) -> route()., 


-type direction() :: north | south | east | west. 
-type point() :: {integer(), integert()}. 
-type route'( ) :: [{9g0,direction(),integer()}]. 


这 个 模块 导出 了 一 个 名 为 pLan_route/2 的 困 数 。 该 函数 的 输入 和 返回 类 型 由 一 个 类 型 规范 
(type specification ) 指定 ， 类 型 声明 (type declaration ) 里 还 定义 了 三 个 新 的 类 型 。 对 它们 的 解读 
如 下 : 
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@ -spec plan route(point{(), point(})) -> route{). 
它 的 意思 是 如 果 调 用 plan_route/2 也 数 时 使 用 了 两 个 类 型 为 point() 的 参数 ， 此 函数 就 
会 返回 一 个 类 型 为 route( ) 的 对 象 。 





@ -type direction(} :: north | south | east | west. 
引入 一 个 名 为 direction() 的 新 类 型 ， 它 的 值 是 下 列 原子 之 一 : north、south、east 或 
West。 





@ -type point() :; {integer{), Integer(}}. 
指 point() 类 型 是 一 个 包含 两 个 整数 的 元 组 ( integer() 是 预定 义 类 型 )。 


(一 


@ -type route() :: [{go, direction(), integer(})}]. 
将 route() 类 型 定义 为 一 个 由 三 元 组 (3-tuple ) 构成 的 列表 , 每 个 元 组 都 包含 一 个 原子 go， 
一 个 类 型 为 direction 的 对 象 和 一 个 整数 。[X] 这 种 表示 法 的 意思 是 一 个 由 X 类 型 构成 的 
列表 。 


单 插 类 型 注解 我 们 就 能 想象 到 执行 pLan_route 后 会 看 到 如 下 输出 : 


> walks:plan route({1,10}, {25, 57})., 
[{90, east, 24}, 
{9g90, north, 47}, 





] 
当然 ， 我 们 完全 不 知道 plan_route 孙 数 到 底 会 不 会 运 回 ， 也 许 它 下 接骨 沉 了， 不 会 返回 任 
何 值 。 但 如 果 它 真 的 返回 了 一 个 值 ,， 那么 当 输 入 参数 的 类 型 是 point() 时 ,返回 值 的 类 型 应 该 是 
route()。 同样 不 知道 之 前 那个 表达 式 里 的 数字 有 什么 含义 。 它们 是 问 里 、 公 里 、 厘 米 还 是 其 他 ? 
所 知道 的 就 是 类 型 声明 能 告诉 我 们 的 ， 即 它们 都 是 整数 。 
为 了 增强 类 型 的 表达 能 力 , 可 以 用 描述 性 变量 给 它们 加 上 注解 。 举 个 例子 , 修改 plan_route 
的 规范 如 下 : 


-spec plan route(From:: point(), To:: point()) -> ... 


类 型 注解 里 的 名 称 From (起 点 ) 和 To (终点 ) 让 用 户 对 这 些 参数 在 函数 里 扮演 的 角色 有 了 
一 定 的 了 解 。 它 们 还 用 来 在 文档 里 的 名 称 和 类 型 注解 里 的 变量 之 间 建 立 联系 。Erlang 的 官方 文档 
对 于 编写 类 型 注解 有 春 严格 的 规定 ， 使 类 型 注解 里 的 名 称 能 够 对 应 文档 里 的 名 称 。 

声明 我 们 的 路 径 (route ) 从 From 开 始 并 且 From 是 一 对 整数 可 能 足以 描述 该 函数 ,也 可 能 需 
要 更 多 信息 ， 这 需要 根据 上 下 文 确定 。 可 以 通过 添加 更 多 的 信息 来 轻松 改进 类 型 定义 。 比 如 这 
“< 

-type angle!() :: {Degrees::0..360, Minutes::0,.60, Seconds::0..60}. 


-type position() :: {latitude | longitude, angle()}. 
-spec plan routel(From::position(), To::position()) -> ... 
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这 种 新 形式 提供 了 很 多 的 信息 , 但 是 仍然 免不了 让 人 猜测 。 我 们 可 能 会 猜想 角度 的 单位 是 度 
( degree )， 因 为 允许 值 的 范围 是 9 到 360， 但 它们 也 可 能 是 弧度 ,这样 的 话 就 猿 错 了 。 

随 着 类 型 注解 变 得 越 来 越 长 , 追求 更 加 精确 最 终 可 能 会 以 文字 宛 长 作为 代价 。 越 来 越 庞大 的 
注解 可 能 会 让 代码 变 得 难以 阅读 。 编 写 好 的 代码 注解 和 编写 好 的 代码 一 样 , 也 是 一 种 艺术 一 一 它 
非常 困难 ， 需 要 多 年 的 练习 。 它 是 参禅 的 一 种 形式 : 你 做 得 越 多 ， 就 越 容 易 ， 做 得 也 越 好 ! 

我 们 已 经 通过 一 个 人 简单 的 例子 看 到 了 类 型 是 如 何 定 义 的 ,下 一 市 将 正式 介绍 类 型 表示 法 ,在 
此 之 后 ， 我 们 将 进入 dialyzer 的 教程 。 


9.2 Erlang 的 类 型 表示 法 


到 目前 为 止 , 我 们 已 经 通过 非 正 式 的 方式 介绍 了 类 型 。 要 充分 利用 类 型 系统 , 需要 理解 类 型 
的 语法 ， 这 样 才能 阅读 和 编写 更 准确 的 类 型 描述 。 





9.2.1 类 型 的 语法 


类 型 定义 可 以 使 用 以 下 的 非 正式 语法 : 

TE A 

它 的 意思 是 T1 被 定义 为 A、B 或 C 其 中 之 一 。 

用 这 种 表示 法 ， 可 以 定义 一 些 Erlang 类 型 如 下 : 


Type :: any() | none() | pid() | port() | reference() | [ 
Atom | binary(}) | float() | Fun | Integer | [Typel] | 
Tuple | Union | UserDefined 





Union :: Typel | Type2 | ... 
Atom :: atom() | Erlang Atom 
Integer :: integer() | Min .., Max 
Fun :: fun() | fun((...) -> Type) 


Tuple ;: tuple() | {T1, 1T2, ... Tn} 

在 上 面 的 例子 中 ，any() 是 指 任意 Erlang 数 据 类 型 ，X() 是 指 一 个 类 型 为 X 的 Erlang 对 象 ， 而 
none () 标 识 则 用 来 指 代 永 不 返回 的 函数 类 型 。 

[X] 这 种 表示 法 指 代 一 个 由 Xx 类 型 构成 的 列表 ，{T1，T2，...，Tn} 指 代 一 个 大 小 为 nh， 参数 
类 型 分 别 为 T1，T2，..，Tn 的 元 组 。 

定义 新 的 类 型 可 以 使 用 以 下 语法 : 

-type NewTypeName (TVarl, TVar2, ... TVarN) :: Type， 


TVarl 至 TVarN 是 可 选 的 类 型 变量 ，Type 是 一 个 类 型 表达 式 。 
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这 里 有 一 些 例 子 : 


-type 
-type 
-type 
-type 
-type 
-type 


on0ff() :: on | off. 

person() :: {person, name(), age()}. 
people() :: [person()]. 

name () :: {firstname, string()}. 
age() :: lnteger(). 

dict(Key,Val) :: [{Key,Val}]. 


根据 这 些 规 则 , {firstname, "dave"} 属 于 name() 类 型 , [{person, {firstname, "john"}， 
35}，f{person，{firstname, "mary"}，26}] 属 于 people() 类 型 ， 以 此 类 推 。dict (Key ,Val) 
类 型 展示 了 类 型 变量 的 用 法 ， 它 把 一 个 字典 类 型 定义 为 由 {Key，Val} 元 组 构成 的 列表 。 





9.2.2 预定 义 类 型 


除了 类 型 语法 以 外 ， 还 有 下 面 这 些 预 定义 的 类 型 别名 : 


-type 
-type 
-type 
-type 
-type 
-type 
-type 
-type 
-type 
-type 
-type 


-type 
-type 
-type 
-type 
-type 


term() :: any(). 

boolean() :;:; true | false., 

byte() :: 0.,.255. 

char() :: 0..16#10ffff. 

number() ::; integer() | float'(). 

list() :: [any()]. 

maybe improper list() :: maybe improper tist(any(), any()). 
maybe improper list{T) :: faybe improper list(T, any())}). 


string() :: [char()]. 
nonempty string() :: [char(),...]. 


iotist{) :: maybe improper tist(byte{()} | binary() | iolist(), 
binary() |] {]). 

module{)} :: atom()., 

mfa() :: {atom{}, atom(), atom(}}. 

node() :: atomt({). 

timeout() :: infinity | non neg integer(). 

no_return() :: none(). 








maybe improper list 用 于 指定 带 有 非 空 (non-nil ) 最 终 列表 尾 的 列表 类 型 。 这 样 的 列表 
很 少 会 用 到 ,但 是 指定 它们 的 类 型 是 可 能 的 | 

还 有 少量 其 他 的 预定 义 类 型 。non_neg_integer() 是 一 个 非 负 的 整数 ，pos_integer() 是 
一 个 正 整 数 ，neg_integer() 是 一 个 负 整 数 。 最 后 ，[X,...] 这 种 表示 法 的 意思 是 一 个 由 X 类 型 








构成 的 非 空 列表 。 
现在 我 们 能 定义 类 型 卫 ， 接 下 来 介绍 函数 规范 。 


9.2.3 ”指定 函数 的 输入 输出 类 型 
函数 规范 说 明了 某 个 函数 的 参数 属于 何 种 类 型 , 以 及 该 函数 的 返回 值 属于 何 种 类 型 。 函 数 规 
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范 的 编写 方式 如 下 : 
-Spec functionName(T1, 1T2, ..., Tn) -> Tret when 
Ti :: Typel, 
Tj :: Type]j, 


这 里 的 Tl1，T2,...，Tn 描 述 了 某 个 也 数 的 参数 类 型 ，Tret 描 述 了 函数 返回 值 的 类 型 。 如 果 
有 必要 ， 可 以 在 可 选 关 键 字 when 后 面 引入 额外 的 类 型 变量 。 
我 们 将 从 一 个 例子 入 手 。 下 面 这 个 类 型 规范 : 


-shec file:open(FileName, Modes) -> {ok, Handle} | {error, Why} when 





FileName :: string(), 

Modes :: {Mode], 

Mode se Tead | We | ena 
Handle :: file handle(), 

Why :: error term{(). 





说 明 如 果 打 开 FileName 文 件 ， 得 到 的 返回 值 不 是 {ok，Handle} 就 是 {error，Why}。 
FiLeName 是 一 个 字符 串 ，Modes 是 一 个 由 Mode 组 成 的 列表 ， 而 Mode 是 read 、write 等 模式 中 的 
个 


| O 
上 面 这 个 函数 规范 可 以 用 多 种 等 价 的 方式 编写 。 举 个 例子 ， 可 以 像 下 面 这 样 不 使 用 限定 词 


when : 








-Spec file:open(string(), [read|write|...] -> {ok, Handle} | {error, Why} 

这 样 做 的 问题 在 于 : 首先 ， 失去 了 FileName 和 Modes 这 些 描述 性 的 变量 ; 其 次 ， 类 型 规范 的 
长 度 大 大 增加 ， 导 致 阅 旋 和 在 打印 文档 里 格式 化 的 难度 增加 。 在 理想 情况 下 ,程序 的 后 面 应 该 附 
有 文档 ， 而 如 采 没 有 给 函数 的 参数 命名 ， 就 无 法 在 文档 里 引用 它们 。 

在 第 一 种 编写 规范 的 方式 下 是 这 么 写 的 : 


-spec file:open(FileName, Modes) -> {ok, Handle} | {error, Why} when 
FileName :;: string(), 














这 个 函数 的 任何 文档 都 可 以 毫 无 玻 义 地 引用 打开 的 文件 ， 方 法 是 使 用 其 名 称 FiteName。 如 
采 于 人 弃 了 限定 词 when: 

-spec file:open(string(), [read|write|...) -> {ok, Handle} | {error, Why}. 

那么 文档 在 引用 打开 的 文档 时 就 不 得 不 称 其 为 “open 函 数 的 第 一 个 参数 ”， 这 种 迁 回 的 说 法 
对 第 一 种 规范 编写 方式 而 言 是 不 必要 的 。 

类 型 变量 可 以 在 参数 里 使 用 ， 如 下 所 示 : 


-Spec lists:map(fun((A) -> B), [A]) -> [B]. 
-Spec lists:filter(fun((X) -> bool()), [xX]) -> [X]. 


它 的 意思 是 map 函 数 接受 一 个 从 A 类 型 到 B 类 型 的 函数 和 一 个 由 A 类 型 对 象 组 成 的 列表 ， 人 然后 
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返回 一 个 由 B 类 型 对 象 组 成 的 列表 ， 以 此 类 推 。 
9.2.4 ”导出 类 型 和 本 地 类 型 


有 时 候 我 们 希望 茶 个 类 型 的 定义 局 限 在 该 定义 所 属 的 模块 内 部 , 而 在 另 一 些 情况 下 则 和 希望 把 
此 类 型 导出 至 别 的 模块 。 想象 一 下 有 两 个 模块 a 和 b。a 模 块 生成 rich_text 类 型 的 对 象 ，b 模 块 则 
操作 这 些 对 象 。 在 a 模块 里 加 入 以 下 注解 : 











-module(a). 
-type rich text() :: [{font(), char()}]. 
-type font() :: jnteger(). 


-export type( [rich text/0, font/0]). 


我 们 不 仅 声 明了 一 个 富 文本 和 一 个 字体 类 型 ， 还 用 注解 -export_ type(...) 导 出 了 它们 。 

假设 b 模 块 能 操作 富 文本 的 实例 ， 比 如 内 含 一 个 计算 军 文 本 对 象 长 度 的 rich_text_ Length 
国 数 。 编 写 此 函数 的 类 型 规范 如 下 : 

-module(b)., 








-shec rich text length(a:rich text()) -> integer(). 


rich_text length 的 输入 参数 使 用 了 完全 限定 的 类 型 名 a:rich_text()， 它 是 指 从 a 模块 
导出 的 rich_ text() 类 型 。 


9.2.5 不 透明 类 型 


在 上 一 六 里 ，a 和 b 这 两 个 模块 通过 操作 宇文 本 对 象 的 内 部 结构 相互 协作 。 但 是 ， 我 们 也 许 
希望 隐藏 富 文 本 数据 结构 的 内 部 细 市 , 使 得 只 有 创建 此 数据 结构 的 模块 才 了 解 类 型 的 细 市 。 可 以 
通过 一 个 例子 来 更 好 地 理解 这 一 点 。 

假设 a 模块 的 开头 部 分 如 下 : 

-module(a). 


-opaque rich text() :: [{font(), char()}]. 
-export typel([rich text/0]). 











-export( [make text/l1, bounding box/1]). 

-Shec make text(string()) -> rich text(). 

-Spec bounding box(rich text()) -> {Height::integer(), Width::integer()}. 
下 面 这 个 语句 : 

-opaque rich text() :: [{font(), char()}]. 


创建 了 一 个 名 为 rich_text() 的 不 透明 类 型 ( opaque type )。 现 在 来 看 一 些 尝 试 操 作 富 文本 
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对 和 象 的 代码 : 


-module(b). 


do this() -> 
X= a:make text("hello world"), 
{W, H} = a:bounding box(X) 
b 模 块 永 远 不 需要 知道 变量 X 的 内 部 结构 。X 是 在 a 模块 里 创建 的 ， 调 用 bounding _box(X) 时 
会 把 它 传 回 a。 
现在 假设 我 们 编写 了 一 段 利 用 了 某 些 rich text 对 象 外 形 知识 的 代码 。 比 如 , 假设 创建 了 一 
个 富 文 本 对 象 ， 然 后 询问 需要 什么 字体 来 演 染 此 对 象 。 我 们 也 许 会 这 么 写 : 


-module(c). 

















fonts in(Str) -> 
X = a:make text(Str), 
[F || {F, } <- X]. 

在 列表 推导 里 ， 我们 “知道 ”XxX 是 一 个 由 双 元 组 构成 的 列表 ， 而 在 a 模块 里 声明 过 make text 
的 返回 类 型 是 不 透明 的 , 意思 是 我 们 不 该 知道 此 类 型 的 任何 内 部 结构 信息 。 利 用 此 类 型 的 内 部 结 
构 信 息 被 称 为 抽象 违规 ( abstraction violation )， 如 果 正 确 声 明了 相关 函数 的 类 型 可 见 性 ， 这 一 违 
规 就 可 以 被 dialyzer 检 测 出 来 。 
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第 一 次 运行 dialyzer 时 ， 需 要 为 打算 使 用 的 所 有 标准 库 类 型 建立 缓存 。 这 个 
次 。 启 动 dialyzer 后 它 会 告诉 你 怎么 做 。 

$ dialyzer 

Checking whether the PLT /Users/]joe/ .dialyzer ptt is up-to-date... 

dialyzer: Could not find the PLT: /Users/joe/ .dialyzer plt 

Use the options: 


--build pit to build a new PLT,; or 
--add to plt to add to an existing PLT 


For example, Use a command Like the following: 
dialyzer --build plt --apps erts kernel stdlib mnesia 


PLT 是 Persistent Lookup Table ( 持久 性 查询 表 ) 的 缩写 。PLT 应 当 包 含 标准 系统 里 所 有 类 型 的 
缓存 。 生 成 PLT 需 要 花费 几 分 钟 的 时 间 。 我 们 输入 的 第 一 个 命令 会 生成 erts、stdlib 和 kernel 
的 PLT。 
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$ dialyzer --build plt --apps erts kernel stdlib 
Compiling some key modules to native code... done in Om59.78s 
Creating PLT /Users/joe/.dialyzer plt ... 
Unknown functions : 

compile:file/2 

compile:forms/2 

compile:noenv forms/2 

compile:output generated/l1 
crypto:des3 cbc decrypt/5 

crypto:start/0 

Unknown types.: 

compile:option/0 

done In 4m3.865S 

done (passed successfully) 


现在 PLT 已 经 建成 , 我 们 准备 好 运行 dialyzer 了 。 出 现 未 知 子 数 的 警告 是 因为 列 出 的 函数 存在 
于 外 部 的 应 用 中 ， 不 属于 我 们 选择 进行 分 析 的 这 三 个 。 

dialyzer 很 很 保守 。 如 果 它 抱 忽 了 ， 那 就 说 明 程 序 里 确实 存在 着 不 一 至 性 。 制 作 dialyzer 项 目 
的 一 个 目标 就 是 消除 虚假 警告 消息 ， 即 并 非 针 对 真正 错误 的 警告 消息 。 

在 接 下 来 的 几 节 里 ， 我 们 会 给 出 一 些 错误 程序 的 例子 ， 对 这 些 程序 运行 dialyzer， 并 展示 
dialyzer 能 够 报告 哪些 类 型 的 错误 。 


9.3.1 误 使 用 内 置 函 数 的 返回 值 

















dialyzer/test1 .erl 


-module(test1). 
-export( [f170] ) ， 


f1() -> 
X = erlang:time(), 
seconds (X) ， 


seconds({ Year, Month, Day, Hour, Min, Sec}) -> 
(Hour * 60 + Min)*60 + Sec. 


> dialyzer testl.erl 
Checking whether the PLT /Users/]joe/.dialyzer plt is up-to-date... yes 
Proceeding with analysis... 
testl.erl:4: Function fl/0 has no local return 
testl.erl:6: The call testl:seconds(X 
{non_ neg integer() ,non neg integer(),non neg integer()}) 
will never return since it differs in the lst argument 
from the success typing arguments: ({ , ,_,Number(),number(),number()}) 
testl,erL:8: Function seconds/l1 has no local return 
test]l.erl:8: The pattern { Year, Month, Day, Hour, Min, Sec} can never 
match the type {non neg integer(),non neg integer(),non neg integer()} 
done in OmO.41s 


9.3 dialyzer 教程 119 





这 上段 相当 吓人 的 错误 消息 出 现 的 原因 是 erlang:time() 返 回 一 个 名 为 {Hour，Min，Sec} 的 
三 元 组 ， 而 不 是 我 们 期 望 的 六 元 组 。“Function f1/0 has no local return”( 子 数 f1/0 没 有 
本 地 返回 ) 的 意思 是 f1/0 会 崩溃 。dialvzer 知 道 ertang， time() 的 返回 值 是 {non neg integer()， 
non neg integer(), non neg integer()} 类 型 的 一 个 实例 ， 因 此 绝 不 可 能 匹配 seconds/1 参 
数 的 六 元 组 模式 。 


9.3.2 内置 函数 的 错误 参数 
可 以 通过 dialyzer 来 了 解 是 否 用 错误 的 参数 调用 了 内 置 函 数 。 这 方面 的 例子 如 下 : 














dialyzer/test2.erl 


-Module (test2)., 
-export([f1/0]). 


f1() -> 
tuple size(list to tuple({a,b,c})). 


$ dialyzer test2.,erl 

test2.erl:4: Function f1/0 has no local return 

test2.erl:5: The call erlang:list to tuple({'a','b','c'}) 

will never return since it differs in the lst argument from the 
success typing arguments: ([any()]) 


它 告诉 我 们 List to tuptLe 期 望 的 参数 是 [any()] 类 型 的 ， 而 不 是 { al op 


9.3.3 ”错误 的 程序 逻辑 
dialyzer 还 可 以 检测 出 有 问题 的 程序 逻辑 。 这 里 有 一 个 例子 : 








dialyzer/test3.erl 


-module(test3). 
-export([test/0, factorial/1]1). 


test() -> factorial(-5). 


factorial (0) -> 1,， 
factorial (N) -> N*factorial (N-1). 


$ dialyzer test3.erl 

test3.erl:4: Function test/0 has no local return 

test3.erl:4: The call test3:factorial(-5) WILL never return since 
It differs in the lst argument from the success typing 

arguments: (non neg_ integer()) 


文 其 实 是 相当 厉害 的 。 阶 乘 ( factorial ) 的 定义 有 问题 。 如 果 用 负数 作为 参数 调用 阶乘 ， 
个 程序 就 会 进入 无 限 循环 ， 和 耕 食 栈 空 间 ， 最 终 Erlang 会 因为 内 存 耗 尽 而 月 尘 。dialyzer 根 据 阶 乘 
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参数 属于 non_neg_integer() 类 型 推断 出 factorial(-5) 这 个 调用 是 错误 的 。 

dialyzer 没 有 打印 出 它 推测 的 函数 类 型 ， 所 以 我 们 来 问 问 typer。 

$ typer test3.erl 

-Spec test() -> none(). 

-spec factorial (non neg integer()) -> pos integer(). 

typer 推 测 factorial 的 类 型 是 (non neg integer()) -> pos integer()， 而 test() 的 类 
型 定 none() 。 

这 些 程序 的 推理 过 程 如 下 : 递归 的 基本 情形 是 factoriaL(0) ， 因 此 要 让 factoriat 的 参数 
变 成 0，factorial(N-1) 这 个 调用 就 必须 最 终 降 至 0。 因 此 N 必 须 大 于 等 于 1， 这 就 是 阶乘 类 型 的 
来 由 。 这 一 点 非常 巧妙 。 





9.3.4 使 用 dialyzer 


用 dialyzer 来 检查 程序 里 的 类 型 错误 需要 按照 一 种 特定 的 工作 流 进 行 。 不 要 不 加 任何 类 型 注 
解 就 编写 完整 个 程序 ， 然 后 当 你 感觉 一 切 就 绪 后 再 回 过 头 来 到 处 添加 类 型 注解 并 运行 dialyzer。 
这 么 做 ， 很 可 能 会 见 到 大 量 让 人 困惑 的 错误 ， 从 而 不 知道 该 从 哪里 着手 修复 错误 。 

使 用 dialyzer 的 最 佳 方式 是 将 它 用 于 每 一 个 开发 阶段 。 开 始 编写 一 个 新 模块 时 ， 应 该 首先 考 
虑 类 型 并 声明 它们 ， 然 后 再 编写 代码 。 要 为 模块 里 所 有 的 导出 函数 编写 类 型 规范 。 先 完成 这 一 步 
再 开始 写 代码 。 可 以 先 注释 掉 末 完成 函数 的 类 型 规范 ， 然 后 在 实现 孔 数 的 过 程 中 取消 注释 。 

现在 可 以 开始 编写 图 数 了 ， 一 次 写 一 个 ， 每 写 完 一 个 新 图 数 就 要 用 dialyzer 检 查 一 下 ， 看 看 
能 否 发 现 程序 错误 。 如 果 郴 数 是 导出 的 ， 就 加 上 类 型 规范 ; 如 果 不 是 ， 就 要 考虑 添加 类 型 规范 是 
否 有 助 于 类 型 分 析 或 者 能 帮助 我 们 理解 程序 ( 请 记 住 , 类 型 注解 是 很 好 的 程序 文档 ), 如 果 dialyzer 
发 现 了 任何 错误 ， 就 应 该 停 下 来 思考 并 找 出 错误 的 准确 含义 。 


9.3.5 干扰 dialyzer 的 事物 


dialyzer 很 容易 受到 干扰 。 我 们 可 以 通过 名 循 几 条 简单 的 规则 来 防止 这 种 情况 发 生 。 

口 避免 使 用 -compite(export_atLL) 。 如 果 导 出 了 模块 里 的 所 有 上 因数 ，dialyzer 就 可 能 无 法 
推理 出 某 些 导出 基数 的 参数 ， 因 为 这 些 男 数 的 调用 位 置 和 类 型 可 能 会 千变万化 。 这 些 参 
数 的 信 可 能 会 扩散 到 模块 的 其 他 函数 ， 导 致 让 人 困惑 的 错误 。 

口 为 模块 导出 函数 的 所 有 参数 提供 详细 的 类 型 规范 。 尽 量 给 导出 晒 数 的 参数 设置 最 严格 的 
限制 。 举 个 例子 ， 乍 看 之 下 你 可 能 会 推 新 吨 数 的 某 个 参数 是 一 个 整数 ， 但 经 过 进一步 思 
考 ， 也 许 就 能 确定 该 参数 是 一 个 正 整 数 ， 甚 至 位 于 某 个 范围 之 内 。 把 类 型 设置 得 越 精 确 ， 
dialyzer 的 分 析 结 果 就 越 出 色 。 男 外 ， 如 果 可 能 ， 你 还 应 该 为 代码 添加 精确 的 关卡 测试 。 
这 会 有 助 于 程序 分 析 ， 而 且 往 往 能 帮助 编 详 天 生成 质量 更 高 的 代码 。 

口 为 记录 和 定义 里 的 所 有 元 素 提供 默认 的 参数 。 如 果 不 提 供 , 原子 undefined 就 会 被 当成 默认 
值 ， 而 这 个 类 型 会 逐渐 扩散 到 程序 的 其 他 部 分 ， 可 能 导致 育 特 的 类 型 错误 。 
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口 把 匿名 变量 用 作 哺 数 的 参数 经 第 会 导致 结 果 类 型 不 如 你 预想 得 那么 精确 。 要 尽 可 能 地 给 
变量 诱 加 限制 。 


9.4 类 型 推断 与 成 功 分 型 


dialyzer 生 成 的 某 些 错误 十 分 柯 特 。 要 理解 这 些 错误 ， 必 须 理解 dialyzer 得 出 Erlang 困 数 类 型 
的 过 程 。 理 解 它 能 帮助 我 们 解 谈 这 些 古 怪 的 错误 消息 。 

类 型 推断 ( type inference ) 是 指 通 过 分 析 代 码 得 出 函数 类 型 的 过 程 。 要 做 到 这 一 点 ， 我 们 会 
分 析 程 序 ， 寻找 约 来 条 件 。 用 这 些 约束 条 件 构 建 出 一 组 约束 方程 式 ， 然后 求解 。 得 到 的 一 组 类 型 
就 被 称 为 此 程序 的 成 功 分 型 (success typing )。 来 看 一 个 人 简单 的 模块 ， 看 看 它 能 告诉 我 们 什么 。 


dialyzer/types1.erl 





-module(types1). 
-export([f1/1, f2/1, f3/1]). 


fi({H,M,S}) -> 
(H+M*60)*60+S5., 

f2({H,M,S}) when is integer(H) -> 
(H+M*60 ) *60+S. 


f3({H,M,S}) -> 
print(H,M,S), 
(H+M*60)*60+5. 


print(H,M,S) -> 
Str = integer to list(H) ++ ":" ++ integer to list(M) ++ ":" ++ 
integer to list(S), 
ijo:format("~s", [Str]). 
在 阅读 下 一 半 之 前 ， 请 花 一 点 时 间 仔 细 观 察 上 面 的 代码 ， 试 看 找 出 代码 里 各 个 变量 的 类 型 。 
下 面 是 运行 dialyzer 之 后 所 发 生 的 事 : 
$ dialyzer typesl.erl 
Checking whether the PLT /Users/joe/ .dialyzer plt jis up-to-date... yes 


Proceeding with analysis... done in QOm0.41s 
done (passed successfully) 


dialyzer 在 这 段 代码 里 没有 找到 类 型 错误 。 但 这 并 不 意味 着 代码 就 是 正确 的 ， 它 仅仅 是 指 程 
序 里 所 有 数据 类 型 的 使 用 方式 相互 一 致 。 我 在 把 时 、 分 、 秘 转换 成 秒 时 写 的 是 (H+M*60)*#60+5 ， 
而 这 是 完全 错误 的 ， 应 该 是 (H*60+M)*60+5。 没有 任何 类 型 系统 能 检测 出 这 一 点 。 所 以 即使 程序 
具备 正确 的 类 型 ， 仍 然 需 要 对 其 进行 案例 测试 。 

在 这 个 程序 上 运行 typer 会 产生 以 下 输出 : 

$ typer typesl.erl 

%% File: "typesl.erl'" 


位 -… 心 
VT Om 
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-spec fl({number(),number(),number()}) -> number(). 

-spec f2({integer(),number() ,number()}) -> number(). 

-spec f3({integer(),integer(),integer()}) -> integer(). 
r( 


-spec print(integer(),integer(),integer()) -> 'ok'. 


typer 会 报告 它 分 析 的 模块 里 所 有 荫 数 的 类 型 。typer 将 函数 f1 的 类 型 说 明 如 下 : 

-Spec fl({number(),number(),number()}) -> number(). 

这 可 以 通过 观察 f1 的 定义 得 出 ， 它 的 定义 如 下 : 

fl({H,M,S}) -> 

(H+M*60O) *60+5. 

这 个 孔 数 为 我 们 提供 了 5 个 不 同 的 约束 条 件 。 首 先 ，f1 的 参数 必须 是 一 个 包含 三 个 元 素 的 元 
组 。 其 次 ， 每 个 算术 操作 人 符 都 增加 了 一 个 约束 条 件 。 比 如 ， 子 表达 式 M*60 告 诉 我 们 M 必 须 属于 
number() 类 型 ， 因 为 乘法 操作 符 的 左右 参数 都 必须 是 数字 。 类 似 地 ，. . .+5 也 告诉 我 们 5 必须 是 
一 个 数字 。 

现在 来 看 看 冰 数 f2。 下 面 列 出 了 它 的 代码 和 推 鄙 类 型 : 


f2({H,M,S}) when is integer(H) -> 
(H+M*60 ) *60+S., 








-spec f2({integer(),number(),number()}) -> number(). 


添加 的 关卡 is_integer(H) 是 一 个 额外 的 约束 条 件 ， 即 H 必 须 是 一 个 整数 。 这 个 约束 条 件 改 
变 了 f2 元 组 参数 里 第 一 个 元 素 的 类 型 ， 把 它 从 number() 改 成 了 更 精确 的 integer() 类 型 。 

请 注意 ， 这 里 严 间 的 说 法 应 该 是 “添加 了 额外 的 约束 条 件 ， 因 此 ， 如 果 该 函数 能 正常 工作 ， 
H 就 必然 是 一 个 整数 ”。 这 就 是 我 们 把 孔 数 的 推断 类 型 称 为 合格 类 型 的 原因 ， 从 字面 上 讲 就 是 “要 
让 函数 能 成 功 执行 ， 它 的 参数 就 必须 属于 这 个 类 型 ”。 

现在 来 关注 typesl.ert 的 最 后 一 个 函数 。 

f3({H,M,S}) -> 


print(H,M,S) ， 
(H+M*60)*60+S. 








print(H,M,S) -> 
Str = integer to List(H) ++ ":" ++ integer to list(M) ++ ":" ++ 
Integer to list(S), 
io:format("~s", [Str]). 


它 的 推断 类 型 如 下 : 


-Spec f3{({integer(),integer{),integer()}) -> integer(). 
-Spec print(integer(),integer(),integer())} -> 'ok'. 


这 里 你 就 能 看 到 对 integer to list 的 调用 是 如 何 把 它 的 参数 限制 成 一 个 整数 的 。 随 后 ， 
这 个 出 现在 print 函 数 里 的 约束 条 件 扩散 到 了 f3 王 数 的 主体 中 。 
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如 你 所 见 ， 类 型 分 析 的 过 程 有 两 个 阶段 。 首 先 会 得 出 一 组 约束 方程 式 , 然后 进行 求解 。 如 果 
dialyzer 没 有 找到 错误 ， 就 表明 这 组 约束 方程 式 是 有 人 解 的 ，typer 则 会 打印 出 这 些 方程 的 解 。 如 末 
这 些 方程 式 存 在 不 一 致 性 ， 无 法 求解 ，dialyzer 束 会 报告 一 个 错误 。 

现在 ， 对 之 前 的 程序 做 一 点 小 改动 来 引入 一 个 错误 ， 看 看 会 对 分 析 造 成 怎样 的 影响 。 


dialyzer/types1_bug.erl 











-module(typesl bug). 
-export([f4/1]). 


f4({H,M,S}) when is float(H) -> 
print(H,M,S) ， 
(H+M*60)*60+S. 


print(H,M,S) -> 
Str = integer to list(H) ++ ":" ++ integer to list(M) ++ ":" ++ 
Integer to list(S), 
lo:format("~s", [Str]). 


首先 运行 typer。 


$ typer typesl bug.erl 

-Spec f4( ) -> none(). 

-spec print(integer(),integer(),integer()) -> 'ok'. 

typer 报 告 说 f4 的 返回 类 型 是 none( )。 这 个 特殊 类 型 的 蕊 思 是 “此 函数 永远 不 会 返回 ”。 

运行 dialyzer 时 会 看 到 以 下 输出 : 

$ dialyzer types1 bug.erl 

typesl1 bug.erl:4: Function f4/1 has no Local return 

typesl] bug.erl:5: The call typesl bug:print(H::float(),M::any(),S::any()) 
will never return since lt differs in the lst argument from the 
success typing arguments: (integer(),integer(),1integer()) 

typesl bug.erl:8: Function print/3 has no local return 

typesl bug.erl:9: The call erlang:integer to list(H::float()) 
will never return since lt differs in the lst argument from the 
success typing arguments: (integer()) 


现在 回 过 头 来 观察 一 下 代码 。 关 卡 测试 is float(H) 告 诉 系 统 H 必 然 是 一 个 浮 点 数 。 而 随 着 H 扩 
散 到 print 孙 数 ，print 内 部 的 函数 调用 integer_to_list(H) 却 告诉 系统 H 必 然 是 一 个 整数 。 现 在 
dialyzer 无 法 确定 这 两 种 陈述 哪 一 种 才 是 正确 的 ,因此 假定 它们 都 是 错误 的 。 这 就 是 它 报告 “Function 
print/3 has no local return vatue”(print/3 国 数 没有 本 地 返回 值 ) 的 原因 。 这 是 类 型 系统 
的 局 限 性 之 一 ， 它 们 能 报告 的 就 是 程序 存在 不 一 致 性， 然后 把 问题 留 给 程序 员 来 分 析 解 决 。 


9.5 ”类 型 系统 的 局 限 性 
让 我 们 来 看 一 下 给 代码 添加 类 型 规范 后 会 发 生 什么 。 我 们 将 从 众所周知 的 布尔 函数 and 开 
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台 。and 只 有 在 它 的 两 个 参数 都 为 true 时 才 为 true， 如 果 任 何 一 个 参数 是 faLtse， 它 的 值 就 是 
faLse。 和 定义 一 个 myand1 国 数 ( 它 的 工作 方式 应 该 和 and 一 样 ) 如 下 : 


types1.erl 


myandl(true, true) -> true; 
myandl(false, ) -> false; 
myandl( ,， false) -> false. 


对 它 运行 typer 后 可 得 到 以 下 输出 : 


$typer typesl.erl 
-spec myandi( ，) -> boolean(). 


myand1 的 推断 类 型 是 ( ，) -> boolean()， 意思 是 myand1 的 各 个 参数 都 可 以 是 任何 你 言 
欢 的 值 ， 返 回 的 类 型 则 是 poolean。“myand1 的 参数 可 以 是 任何 值 ”这 个 推断 依据 的 是 参数 位 置 
里 的 下 划 线 。 比 如 ，myand1 的 子 句 2 是 myand1l(false， ) -> false， 基 于 此 它 推断 出 第 二 个 
参数 可 以 是 任何 值 。 

现在 ,假设 给 这 个 模块 添加 一 个 错误 的 bug1 函 数 如 下 : 

types1.erl 


bugl(X, Y) -> 
case myandl (XxX, Y) of 
true -> 
XxX+Y 





end ， 

然后 让 typer 分 析 这 个 模块 。 

$ typer typesl.erl 

-spec myandl( ，) -> boolean()., 

-spec bugl(number(), number()) -> number(). 

typer 知 道 + 用 两 个 数字 作为 参数 并 返回 一 个 数字 ， 因 此 推 央 X 和 Y 都 是 数字 。 它 还 推 新 出 
myand1 的 参数 可 以 是 任何 值 ， 这 与 X 和 Y 都 是 数字 不 了 矛盾。 如 果 在 这 个 模块 上 运行 dialyzer， 它 是 
不 会 返回 错误 的 。typer 认 为 用 两 个 数字 参数 调用 bug1 会 返回 一 个 数字 ,但 它 不 会 。 它 会 朋 沉 。 
这 个 例子 展示 了 参数 类 型 规范 的 不 到 位 〈《 即 把 _ 当 作 类 型 而 非 booLean() ) 会 导致 分 析 程 序 时 无 
法 发 现 的 错误。 

现在 我 们 对 类 型 的 了 解 已 经 足够 了 。 作为 本 书 第 二 部 分 的 结尾 , 我 们 将 在 下 一 章 里 介绍 编 详 
和 运行 程序 的 多 种 方式 。 我 们 能 进行 的 shell 操 作 里 有 很 大 一 部 分 可 以 目 动 化 进行 ,下 一 革 将 介绍 
几 种 实现 方式 。 读 完 下 一 章 后 ， 你 就 具备 了 所 有 构建 和 运行 顺序 Erlang 代 码 的 知识 。 在 此 之 后 ， 
就 可 以 转 疝 并 发 编程 了 。 其 实 ， 并 发 编程 才 是 本 书 的 主题 , 但 要 跑 必须 先 学 会 走路 ,要 进行 并 发 
编程 必须 完 学 会 顺序 编程 。 
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9.6 练习 


(1) 编写 一 些 导出 单个 函数 的 小 模块 ， 以 及 被 导出 孔 数 的 类 型 规 郊 。 在 函数 里 制造 一 些 类 型 
错误 ， 然 后 对 这 些 程序 运行 dialyzer 并 试 春 理解 错误 消息 。 有 时 候 你 制造 的 错误 无 法 被 dialyzer 发 
现 ， 请 仔细 观察 程序 ， 找 出 没有 得 到 预期 错误 的 原因 。 

(2) 观察 标准 库 代 码 里 的 类 型 注解 。 找 到 Lists.ert 模 块 的 源 代 和 码 并 阅读 里 面 所 有 的 类 型 
注解 。 

(3) 为 什么 在 编写 模块 前 需要 先 思考 里 面 图 数 的 类 型 ? 它 是 否 在 任何 情况 下 都 是 一 个 好 主意 ? 

(4) 对 不 透明 类 型 做 些 试验 。 创 建 两 个 模块 ， 第 一 个 模块 导出 一 个 不 透明 类 型 ， 第 二 个 模块 
以 能 导致 抽象 违规 的 方式 使 用 该 不 透明 类 型 的 内 部 数据 结构 。 在 这 两 个 模块 上 运行 dialyzer 并 确 
保 理 解 了 错误 消息 。 
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我 们 在 前 面 几 章 里 并 没有 过 多 谈 及 如 何 编译 和 运行 程序 ， 所 用 的 都 是 Erlang shell。 这 对 小 例 
子 来 说 足够 了 , 但 随 着 程序 变 得 越 来 越 复 沫 ,你 会 希望 这 个 过 程 能 目 动 化 来 让 目 己 轻松 一 点 。 这 
就 要 用 到 makefile。 

事实 上 ,有 三 种 不 同 的 方式 可 以 运行 程序 。 在 这 一 章 里 , 我 们 将 完整 介绍 它们 ， 这样 你 就 可 
以 根据 具体 情况 选择 最 佳 的 方式 了 。 

有 时 候 一 些 问题 会 接连 出 现 : makefile 会 失败 ， 环 境 变 量 会 出 错 ， 你 的 搜索 路 径 也 可 能 不 正 
确 。 我 们 会 帮助 你 应 对 这 些 状况 ， 介 绍 出 错时 应 该 做 些 什 么 。 


10.1 改变 开发 环境 


开始 用 Erlang 编 程 时 ， 多 半 会 把 所 有 的 模块 和 文件 放 在 同一 个 目录 里 ， 然 后 从 这 个 目录 局 动 
Erlang。 如 东 这 人 么 做 ，Erlang 的 载 入 带 可 以 百 分 百 找 到 你 的 代码 。 但 是 ， 随 痢 程 序 变 得 越 来 越 复 
巢 ， 你 会 想 要 把 它们 分 成 多 个 易于 管理 的 区 块 ， 并 把 代码 放 进 不 同 的 目录 里 。 邦 外 ， 当 你 想 要 包 
含 来 目 其 他 项 目的 代码 时 ， 这 些 外 部 代码 会 有 目 己 的 目录 结构 。 


10.1.1 设置 载 入 代码 的 搜索 路 径 


Erlang 的 运行 时 系统 使 用 一 种 代码 上 自动 载 人 机制 。 要 让 它 能 正确 工作 ， 必 须 设 置 一 些 搜 索 路 
径 来 找到 正确 版 本 的 代码 。 

这 种 代码 目 动 载 人 机 制 实 际 上 是 用 Erlang 编 写 的 ， 之 前 在 8.10 和 里 曾经 介绍 过 。 代 码 的 载 入 
是 “ 按 需 进行 ”的 。 

当 系 统 和 尝试 调用 的 国 数 属于 一 个 尚未 加 载 的 模块 时 , 就 会 出 现 一 个 异常 , 系统 会 答 试 寻找 缺 
失 模 块 的 对 和 象 代 人 码 文件 。 如 果 缺 失 的 模块 名 为 nyMissingModule, 代码 载 人 天 就 会 在 当前 载 人 路 
径 的 所 有 目录 里 搜索 一 个 名 为 myMissingModule.beam 的 文件 。 只 要 找到 相符 的 文件 ， 搜索 就 会 
停止 ， 此 文件 的 目标 代码 会 被 载 人 系统 。 

可 以 启动 Erlang shell 然 后 输入 命令 code:get_path() 来 找到 当前 的 载 人 路 径 值 。 这 里 有 一 个 
例子 : 
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1> Code:get_path( ) . 

[人 
"/usr/local/lib/erlang/lib/kernel-2.15/ebin", 
"/usr/local/lib/erlang/lib/stdlib-1.18/ebin", 
"/home/joe/installed/proper/ebin", 
"/usr/local/lib/erlang/lib/xmerl-1.3/ebin", 
"/usr/local/lib/erlang/lib/wx-0.99.1/ebin", 
"/usr/local/lib/erlang/lib/webtool-0.8.9.1/ebin", 
"jusr/local/lib/erlang/lib/typer-0.9.,.3/ebin", 
"/usr/local/lib/erlang/lib/tv-2.1.4.8/ebin", 
"/usr/local/lib/erlang/lib/tools-2.6.6.6/ebin", 
| 


以 下 是 两 个 最 第 用 来 操作 载 入 路 径 的 函数 : 





@ -spec code:add pathalDir) => true | {error, bad directory} 


问 载 和 路径 的 开头 添加 一 个 新 目录 Dir。 


® -spec code:add pathztDirn) => true | {error, bad directory} 


问 载 和 路径 的 末 闪 添加 一 个 新 目录 Dir。 


使 用 哪个 通常 无 关 紧要 。 唯 一 要 留心 的 是 add_patha 和 add pathz 是 否 会 导致 不 同 的 结果 。 
如 果 你 怀疑 载 信 了 错误 的 模块 ， 可 以 调用 code:all loaded() (返回 一 个 已 加 载 模块 的 总 列表 ) 
或 code:clash() 来 帮助 调查 哪里 出 了 错 。 

code 模 块 里 的 其 他 一 些 函 数 也 能 够 操作 路 径 ， 不 过 你 很 可 能 用 不 到 这 些 函 数 ， 除 非 正 在 做 
一 些 古 怪 的 系统 编程 。 

通常 的 惯例 是 把 这 些 命 令 放 在 主 目录 (home directory ) 里 一 个 名 为 ,ertang 的 文件 内 。 

也 可 以 用 这 样 的 命令 来 启动 Erlang: 


$ erl -pa Dirl -pa Dir2 ... -pz DirK1l -pz DirK2 


-pa Dir 标 识 会 把 Dir 添 加 到 代码 搜索 路 径 的 开头 ，-pz Dir 则 会 把 此 目录 添加 到 代码 路 径 
的 末端 。 


10.1.2 ”在 系统 启动 时 执行 一 组 命令 


我 们 已 经 看 到 了 该 如 何在 主 目 录 的 .erLang 文 件 里 设置 载 入 路径。 事实 上 ,你 可 以 把 任意 的 
Erlang 代 码 放 入 这 个 文件 。 启 动 Erlang 时 ， 它 会 首先 读 取 并 执行 此 文件 里 的 所 有 命令 。 
假设 .erlang 文 件 内 容 如 下 : 


io:format("Hi, T'm in your .erlang file~n"). 


























局 动 系统 时 ， 我 们 会 看 到 以 下 输出 : 


$ erl 
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Hi, I'm in your ,erLang file 
Eshell V5.9 (abort with ^ 人 OG) 
了 > 


如 有 果 Erlang 启 动 时 的 当前 目录 里 已 经 有 一 个 .erlang 文 件 ， 它 就 会 优先 于 主 目 录 里 
的 .erlang。 通 过 这 种 方式 ， 可 以 让 Erlang 根 据 不 同 的 启动 位 置 表现 出 不 同 的 行为 。 这 对 特定 的 
应 用 程序 来 说 可 能 很 有 用 。 在 这 种 情况 下 ,多半 应 该 把 一 些 打 印 语句 添加 到 启动 文件 里 ,否则 你 
可 能 会 忘记 本 地 启动 文件 的 存在 ， 从 而 感到 非常 困惑 。 








提示 ”在 茶 些 系 统 里 , 主 目录 的 位 置 并 不 清晰 , 或 者 可 能 和 你 认为 的 不 一 样 。 要 找 出 Erlang 认 定 
的 主 目录 位 置 ， 可 以 这 么 做 : 


1> init:get argument (home). 
{ok,[['"/home/joe"]]} 


通过 上 面 的 信息 可 以 推 呆 Erlang 认 为 你 的 主 目录 是 /home/joe。 
10.2 ”运行 程序 的 不 同方 式 


Erlang 程 序 被 保存 在 模块 里 。 编 写 完 程序 之 后 ， 必 须 编 译 它 才能 运行 。 也 可 以 通过 无 需 编 译 
的 escript 来 直接 运行 程序 。 

接 下 来 的 几 节 将 展示 如 何 用 多 种 方式 编译 和 运行 两 个 程序 。 这 两 个 程序 略 有 不 同 , 启动 和 停 
止 它 们 的 方式 也 有 区 别 。 

第 一 个 程序 hello.erl 只 打印 “Hello world”。 它 不 负责 启动 和 停止 系统 ， 也 不 需要 访问 命 
令 行 参 数 。 与 之 相对 ， 第 二 个 程序 fac 需 要 访问 命令 行 参数 。 

下 面 是 基本 的 程序 。 它 打印 出 的 字符 串 是 “Hello world” 再 加 一 个 换行 符 (~n 在 Erlang 的 io 
和 :io_Lib 模 块 里 被 解释 为 换行 符 )。 

hello.erl 


-module(hello). 
-export([start/0]). 

















start() -> 
io:format("Hello wortld~n"). 


可 用 三 种 方式 编译 和 运行 它 。 
10.2.1 在 Erlang shell 里 编译 和 运行 
我 们 从 启动 Erlang shell 开 始 。 


$ erl 


1> c(hello). 
{ok,hello} 
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2> heLLo:startt ) 
Hello world 
ok 


快速 脚本 编程 
我 们 经 常 希 望 能 在 操作 系统 的 命令 行 里 执行 任意 的 Erlang 函 数 。-evat 参 数 非 常 适合 进行 
快速 脚本 编程 。 
2 


erl -eval 'io:format("Memory: ~p~n", [erlang:memory(total)]).'\ 
-hoshell -s init stop 


10.2.2 ”在 命令 提示 符 界面 里 编译 和 运行 


可 以 直接 在 命令 提示 符 界面 里 编译 程序 。 如果 只 是 想 编译 一 些 代码 而 不 运行 它们 , 这 就 是 
简单 的 方式 。 它 的 做 法 如 下 : 
$ erlc hello.erl 


$ erl -noshell -s hello start -s init stop 
Hello world 


$ 





el 


注意 ”本章 所 有 的 shell 命 令 都 假定 用 户 已 经 在 他 们 的 系统 里 安装 了 合适 的 shell, 并 且 erL 和 ertc 
等 命令 能 直接 在 shell 里 执行 。 有 具体 如 何 配 置 系 统 会 随 系 统 和 时 间 点 的 不 同 而 有 所 区 别 。 
你 可 以 在 Erlang 网 站 "和 主 开发 存档 "里 找到 最 新 的 资料 。 


第 1 行 的 erlc hello.erl 编 泽 Jhello.erl 文 件 ， 生 成 了 一 个 名 为 hello .beam 的 目标 代码 
文件 。 第 二 个 命令 有 三 个 选项 。 
口 -nosheLL 以 不 市 交互 式 shell 的 方式 局 动 Erlang ( 因此 不 会 看 到 Erlang 的 “徽标 ”"， 也 就 是 
通常 系统 启动 时 首先 显示 的 那些 信息 )。 
口 -s hello start 运 行 heLLo:start () 国 数 。 注 意 : 使 用 -s Mod .. .选项 时 ，Mod 必 须 是 
已 编译 的 。 
口 -s init stop 在 之 前 的 命令 完成 后 执行 nit:stop() 隐 数 ， 从 而 集 止 系统 。 
erl -noshell .. .命令 可 以 放 在 shell 脚 本 里 ， 所 以 通常 会 制作 一 个 shell 脚 本 来 运行 程序 ， 
里 面 会 设置 路 径 (用 -pa Directory ) 并 局 动 程序 。 
在 这 个 例子 里 用 了 两 个 -s . .命令 。 命 令 行 里 的 因数 数量 是 不 受 限 制 的 。 每 个 -s .. .命令 都 
申 一 个 appLy 语 名 执行， 运行 完毕 后 再 执行 下 一 个 命令 。 








GD http:/www.erlang.org 
@) https://github.com/erlang/otp 
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这 里 有 一 个 启动 hello ,ertL 的 例子 : 


hello.sh 


#!/bin/sh 
erl -noshell -pa /home/joe/2012/book/JAERLANG/Book/code\ 
-Ss hello start -s init stop 


注意 ”这 个 脚本 需要 一 个 指向 hello.,beam 文 件 所 在 目录 的 绝对 路 径 。 所 以 虽然 这 个 脚本 能 在 我 
的 机 器 上 工作 ,但 是 你 必须 修改 一 下 才能 让 它 在 你 的 机 器 上 运行 。 
为 了 运行 shell 肢 本， 我 们 需要 chmod 这 个 文件 (只 需 一 次 )， 然 后 就 可 以 运行 它 了 。 


$ chmod u+x hello,. sh 
$ ./hello.sh 
Hello world 


10.2.3 ”作为 Escript 运 行 


可 以 用 escript 来 让 程序 直接 作为 脚本 运行 , 无需 事先 编译 它们 。 为 了 让 hello 作 为 escript 运 行 ， 
我 们 创建 了 下 面 的 文件 : 








hello 
#!/usSr/bin/env escript 


main(Args) -> 
io:format("Hello world~n"). 


个 文件 必须 包含 一 个 main (Args) 哺 数 。 当 它 从 操作 系统 的 shell 里 调用 时 ，Args 会 包含 一 
WN en 丁 参数。 在 Unix 系 统 上 ， 无 需 编 译 就 可 以 立即 运行 ， 就 像 下 面 这 样 : 
$ chmod u+x hello 


$ ./hello 
Hello world 








注意 ”这 个 文件 的 文件 模式 必须 设置 为 “可 执行 (Unix 系统 上 可 以 输入 命令 chmod u+x File )， 
这 个 操作 只 须 做 一 次 ， 不 是 每 次 运行 程序 时 都 要 做 。 


在 开发 过 程 中 导出 函数 
编写 代码 时 ， 一 件 很 麻烦 的 事 就 是 要 不 断 地 添加 和 移 除 程序 的 导出 声明 ， 从 而 使 导出 的 
程序 可 以 在 shell 里 运行 。 
-compile(export all) .这 个 特殊 声明 能 让 编译 器 导出 模块 里 的 每 一 个 函数 。 这 么 做 能 
让 你 在 编写 代码 时 轻松 很 多 。 
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A 应 该 注释 掉 export all 声 明 并 添加 合适 的 时 出 声明 。 这 么 做 的 原因 有 
两 个 。 首 先 ， 等 你 稍 后 回来 阅读 代码 时 ， 就 会 知道 导出 的 那些 函 考 2 
都 不 能 在 模块 之 外 调用 , 所 以 可 以 用 任何 你 喜欢 的 方式 修改 它们 ， 只 要 确保 对 导出 函数 的 接口 
保持 不 变 即 可 。 其 次 ， 如 果 编 译 器 准确 知道 模块 导出 了 哪些 函数 ， 就 能 生成 更 好 的 代码 。 
请 注意 ,使 用 -compile(export alLL) ， 会 大 大 增加 dialyzer 分 析 代 码 的 难度 。 


10.2.4 ” 带 命令 行 参数 的 程序 


“Hello world” 没 有 任何 参数 。 让 我 们 用 一 个 计算 阶乘 的 程序 来 重复 这 个 练习 。 它 接受 单个 
数 O 
首先 是 它 的 代码 . 


fac.erl 





Wp 








-module (fac). 
-export([fac/1]). 


fac(0) -> 1; 
fac(N) -> N*fac(N-1). 


可 以 像 这 样 编 详 fac,erL 并 在 Erlang shell 里 运行 它 
$ erl 


1> c(fac). 

{ok, fac} 

2> fac:fac(25). 
155112100433309859840009000 





如 果 和 希望 在 命令 行 里 运行 这 个 程序 ， 就 需要 修改 它 ， 让 它 能 够 接受 命令 行 参数 。 
fac1.er| 
-moduLe(facl) ， 


-export( [main/1]). 


main([A]) -> 
I = list to integer(atom to list(A)), 
F = fac(1), 
i0:format( 
init:stop( 


"factorial ~w = ~w~n", [1, Fl]), 


) ， 


fac(0) -> 1; 
fac(N) -> N*fac(N-1)., 


然后 可 以 编译 并 运行 它 。 


$ erlc facl,erl 
$ erl -noshell -s facl main 25 
factorial 25 = 15511210043330985984000000 
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注意 ”这 个 函数 的 名 称 main 没 有 什么 特殊 含义 ， 你 可 以 给 它 取 任何 名 字 。 重 点 是 子 数 名 和 命令 
行 里 的 名 称 要 一 致 。 


最 后 ， 可 以 把 它 作为 escript 运 行 。 


factorial 


#!/usSr/bin/env escript 
main([A]}) -> 
I = list to integer(A), 
F = fac(I), 
lo:format("factorial ~w = ~w~n",{[I, Fl]). 


fac(0) -> 1; 
fac(N) -> 
N * fac({N-1)., 


无 需 编 详 就 可 以 运行 它 ， 如 下 所 示 : 


$ ./factorial 25 
factorial 25 = 15511210043330985984000000 


10.3 ”用 makefile 使 编译 自动 化 


当 我 编写 一 个 很 大 的 程序 时 ,我 喜欢 让 它 尽 可 能 地 目 动 化 。 这 么 做 有 两 个 原因 。 首 先 ， 从 长 
远 来 看 这 能 减少 输入 操作 : 一 遍 壳 输入 相同 的 命令 来 测试 和 重复 测试 程序 需要 大 量 的 按键 操作 ， 
我 可 不 想 磨损 我 的 手指 头 。 

其 次 , 我 经 各 会 暂 俘 手头 上 的 事 ， 转 而 处 理 别 的 某 个 项 目 , 再 回 到 某 个 暂停 的 项 目 可 能 会 是 
几 个 月 以 后 的 事情 了 。 当 我 回来 时 经 常 已 经 志 了 如 何 构 建 项 目 里 的 代码 , 这 时 候 make 就 能 派 上 大 
用 场 了 ! 

make 是 我 唯一 的 任务 自动 化 工具 , 我 用 它 编译 和 分 发 Erlang 代 码 。 我 的 大 多 数 makefile" 都 极 
其 人 简单， 而 且 我 还 有 一 个 简单 的 模板 ， 它 能 满足 我 的 大 多 数 需 要 。 

我 不 会 对 makefile 做 总 体 的 介绍 ， 而 是 展示 我 认为 对 编译 Erlang 程 序 有 用 的 那 种 形式 。 我 们 
会 特别 介绍 本 书 所 附 的 makefileg， 这 样 你 就 能 理解 它们 并 制作 日 己 的 makefile 了 。 
































一 个 makefile 模 板 
下 面 这 个 模板 是 我 制作 大 多 数 makefile 的 基础 : 


(QD) http://en.wikipedia.org/wiki/Make 
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Makefile.template 
# 别 碰 这 几 行 
.SUFFIXES: .erl .beam .yrl 


.Errl.beam: 

erlc -W $< 
.yrl,erl: 

erlc -W $< 


ERL = erl -boot start clean 
# 这 里 是 一 个 想 要 编译 的 ErLang 模 块 列 表 。 
# 如 果 这 些 模块 在 一 行 里 放 不 下 ， 
考 就 在 行 尾 添加 一 个 \ 字符 然后 在 下 一 行 继续 。 
# 编辑 下 面 这 几 行 
MODS = modulel module2 \\ 
module3 ,.., speciall ,.,.,\ 
moduleN 
# 任何 makefiLe 里 的 第 一 个 目标 就 是 默认 的 目标 。 
## 如 果 只 输入 了 "make"， 系 统 就 会 假定 为 "make all",， 
闪 (因为 "all" 是 这 个 makefile 里 的 第 一 个 目标 ) 
all: compile 
compile: ${MODS:%=%,beam} subdirs 
### 此 处 添加 特殊 的 编译 要 求 


speciall.beam: speciall.erl 
${ERL} -Dflagl -WO speciall.erl 





## 从 makefile 里 运行 应 用 程序 


applicationl: compile 
${ERL} -pa Dirl -ss applicationl start Argl Arg2 


六 Subdir 目 标 会 编译 子 目录 里 的 代码 
# sub-directories 


subdirs: 


cd dirl; $(MAKE) 
cd dir2; $(MAKE) 


# 移 除 所 有 代码 
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clean: 
rm -rf *.beam erl crash.dump 
cd dirl; $(MAKE) clean 
cd dir2; $(MAKE) clean 
这 个 makefile 的 开头 部 分 有 一 些 规 则 ， 用 于 编译 Erlang 模 块 和 扩展 名 为 ,yrtl 的 文件 (这些 文 
件 包 含 了 解析 器 定义 ,， 供 Erlang 解 析 需 生成 程序 使 用 )。Erlang 的 解析 器 生成 程序 名 为 yecc ( 它 是 
Erlang 版 的 yacc， 后 者 是 yet another compiler compiler 的 缩写 ， 即 “又 一 个 编译 需 的 编译 项” ， 话 
情 请 见 在 线 教程 ”)。 
重要 的 部 分 是 下 面 这 一 人行: 
MODS = modulel module2 
它 是 一 个 清单 ， 包 含 了 我 想 要 编译 的 所 有 Erlang 模 块 。 
MODS 清 单 里 的 任何 模块 都 会 用 Erlang 命 令 erlc Mod .erl ( Mod 是 模块 名 ) 编译 。 有 些 模 块 可 
能 需要 特殊 对 待 ( 例如 模板 文件 里 的 special1 模 块 ), 所 以 里 面 有 一 条 单独 的 规则 对 此 进行 处 理 。 
makefile 里 有 一 些 目标 (targets )。 目 标 是 一 个 由 字母 数字 组 成 的 字符 串 ， 从 行 首 开始 ， 到 冒 
号 (: ) 结束 。 在 这 个 makefile 模 板 里 ，all、compile 和 special1.beam 都 是 目标 。 要 运行 这 个 
makefile， 你 需要 输入 shell 命 令 。 








$ make [Target] 


参数 Target 是 可 选 的 。 如 果 省 略 了 Target， 系 统 就 假定 是 文件 里 的 第 一 个 目标 。 在 前 面 的 
例子 中 ， 如 果 没 有 在 命令 行 里 指定 目标 ，atll 就 成 了 假定 的 目标 。 

如 果 我 想 要 编译 所 有 的 软件 并 运行 appLication1， 就 会 输入 命令 make application1。 如 
果 我 想 计 它 变 成 默认 的 行为 (只 需 输入 命令 make 就 能 实现 )， 就 会 移动 定义 目标 appLicationl 
的 那 几 行 ， 让 它们 成 为 makefile 里 的 第 一 个 目标 。 

目标 clean 会 移 除 所 有 已 编译 的 Erlang 对 象 代 码 文件 和 erl _crash.dump 文 件 。 这 个 故障 转 储 
( crash dump ) 文件 所 包含 的 信息 有 助 于 对 程序 进行 调试 。 详 情 请 见 10.4.$ 节 。 


精简 makefile 模 板 

我 不 喜欢 杂乱 的 软件 ， 所 以 经 党 一 开始 就 会 移 除 makefile 模 板 里 那些 与 应 用 程序 无 天 的 行 。 
这 能 让 makefile 变 得 更 简短 易 读 。 也 可 以 制作 一 个 公用 的 makefile, 把 它 包 含 在 所 有 的 makefile 里 ， 
并 将 这 些 makefile 里 的 变量 作为 参数 。 

这 个 过 程 完 成 后 ， 我 束 有 了 一 个 高 度 精 和 价 的 makefile， 台 像 下 面 这 个 : 

.SUFFIXES: .erl .beam 


























.er .beam: 
erlc -W $< 


GD http://erlang.org/doc/man/yecc.html 
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ERL = erl -boot start clean 
MODS = modulel module2 module3 


all: compile 
${ERL} -pa '/home/joe/.../this/dir' -s modulel start 


compijile: ${MODS:%=% .beam} 


clean: 
rm -rf *.beam erl_crash.dump 


10.4 ” 当 坏 事 发 生 
这 一 节 列 出 了 一 些 常 见 问 题 ， 以 及 它们 的 解决 方法 。 
10.4.1 停止 Erlang 


有 了 时候 Erlang 会 根本 停 不 下 来 ， 以 下 是 一 些 可 能 的 原因 。 

口 shell 没 有 反应 。 

口 CtrltC 操 作 被 禁用 了 了 。 

口 Erlang 启 动 时 设置 了 -detached 标 识 ， 所 以 你 可 能 不 会 注音 到 它 正在 运行 。 

口 Erlang 启 动 时 设置 了 -heart Cmd 选 项 。 这 个 选项 会 建立 一 个 操作 系统 监控 进程 来 监控 
Erlang 的 操作 系统 进程 。 如 果 Erlang 的 操作 系统 进程 朋 沉 了 ，Cmd 就 会 被 执行 。 通 常 Cmd 只 
是 简单 地 重启 Erlang 系 统 。 这 是 我 们 制作 容错 式 市 点 时 使 用 的 技巧 之 一 一 一 如 果 Erlang 上 自 
二 月 沉 了 (这 理应 不 该 出 现 ), 就 会 自动 重启 。 解决 方法 是 找到 心跳 (heartbeat ) 进程 (用 
类 Unix 系 统 的 ps 和 Windows 的 任务 管理 锅 )， 先 终止 它 ， 然 后 再 终止 Erlang 进 程 。 

口 某 处 可 能 出 了 严重 的 问题 ， 遗 和 留 了 一 个 失去 联系 的 盆 尸 Erlang 进 程 。 


10.4.2 未 定义 “缺失 ) 的 代码 


如 果 代 人 码 载 和 人 带 找 不 到 你 试图 运行 的 代码 所 在 的 模块 ( 因为 代码 搜索 路 径 不 正确 )， 就 会 遇 
到 一 条 undef 错 误 消 息 。 这 里 有 一 个 例子 : 

1> glurk:oops(1,23). 

** exception error: undefined function glurk:o0ps/2 

实际 上 , 名 为 glurk 的 模块 并 不 存在 , 但 这 里 的 问题 不 在 于 此 。 应 该 关注 的 是 这 段 销 误 消 息 。 
它 告诉 我 们 系统 尝试 调用 glurk 模 块 里 涡 有 两 个 参数 的 函数 oops。 因 此 ， 有 四 种 可 能 的 情况 。 

口 gLurk 模 块 确实 不 存在 一 一 尝 无 踪迹 ， 无 处 可 寻 。 这 多 半 是 因为 拼写 错误 。 

D gtLurk 模 块 存 在 ， 但 未 被 编 详 。 系 统一 直 在 代码 搜索 路 径 里 找 的 是 一 个 名 为 9Lurk.beam 

的 文件 。 
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口 glurk 模 块 存在 且 已 编译 ,但 glurk.beam 所 处 的 日 录 不 属于 代码 搜索 路 径 。 要 修复 这 个 
问题 ， 必 须 更 改 搜索 路 径 。 
口 代码 载 人 路 径 里 有 多 个 不 同 版 本 的 glurk， 而 我 们 选择 了 一 个 错误 的 版 本 。 这 种 错误 很 罕 
见 ， 但 也 是 有 可 能 发 生 的 。 
如 果 怀 疑 发 后 了 这 种 错误 ， 可 以 运行 code: ctash() 函 数 ， 它 会 报告 代码 搜索 路 径 里 所 有 重 
复 的 模块 。 





有 谁 看 到 我 的 分 号 了 ? 
如 果 忘 记 在 函数 的 子 句 之 间 放 置 分 号 ,或 者 用 句号 代 蔡 ， 那 就 有 麻烦 了 ， 而且 是 大 麻烦 。 
如 果 在 模块 bar 的 第 1234 行 定义 了 一 个 foo/2 函 数 ， 并 且 把 句号 放 在 了 分 号 的 位 置 上 ， 编 
译 器 就 会 提示 : 
bar.erL:1234 里 的 函数 foo/2 已 被 定义 过 。 
所 以 ， 别 这 么 做 。 请 确保 你 的 子 句 总 是 用 分 号 隔 开 。 


10.4.3 shell 没有 反应 


如 果 shell 不 再 啊 应 命令 ， 那么 可 能 发 生 了 几 种 状况 。shell 进 程 日 刁 可 能 朋 沉 了 , 或 者 你 给 出 
了 一 个 永远 不 会 终止 的 命令 。 其 至 可 能 只 是 忘记 输入 一 个 关闭 引号 , 或 者 忘记 在 命令 结尾 输入 句 
号 加 回 车 。 

无 论 是 什么 原因 ， 都 可 以 按 下 Ctrl+G 来 中 断 当 前 的 shell， 然 后 进行 如 下 处 理 : 


©@ 1> receive foo -> true end. 











人 ^G 
User switch command 
@ --> h 
c [nn] - Connect to job 
i [nn] - interrupt job 
k [nn] - kill job 
] - list all jobs 
S - Start local shell 
r [nodel] - start remote shell 
q - quit erlang 
”| h - this message 
© --> j 
]* {shell,start, [init]} 
@O --> s 
= 


1 {shell,start, [init]} 
2* {shell,start,[]} 
@ --> C 2 
Eshell V5.5.1] (abort with ^ 人 0) 
1> init:stop(). 
ok 
2> $ 


10.4 当 坏 事 发 生 137 


@ 此 处 我 们 让 shell 接 收 一 个 foo 消 息 。 但 因为 没 人 疝 shell 发 送 这 个 消息 ， 所 以 shell 会 处 于 永 
久 等 竺 的 状态 。 我 们 按 下 Ctrl+G 后 进入 shell。 

人 @ 系统 进入 “shell JCL”( Job Control Language， 任务 控制 语言 ) 模式 。 我 们 输入 h 来 获得 一 
些 帮 助 。 

全 输入 j 列 出 了 所 有 的 任务 。 任 务 1 带 有 一 个 星 号 标记 ， 意 思 是 默认 shell。 所 有 带 有 可 选 参 
数 [nn] 的 命令 都 使 用 默认 shell， 除 非 提 供 了 特定 的 参数 。 

@@ 输入 命令 s 启 动 了 一 个 新 的 shell， 然 后 再 输入 j。 这 一 次 我 们 可 以 看 到 两 个 shell， 分 别 标 
记 为 1 和 2，shell 2 现在 成 了 默认 shell。 

四 我 们 输入 c 2， 这 样 束 连 上 了 新 局 动 的 shell 2。 然 后 我 们 停止 了 系统 。 

如 你 所 见 ， 我 们 可 以 让 多 个 shell 同 时 和 运行， 通过 按 Ctrl+G 并 输入 合适 的 命令 来 切换 它们 。 我 
们 甚至 还 可 以 用 r 命 令 在 远程 节点 上 局 动 一 个 shell。 











10.4.4 我 的 makefile 不 工作 





makefile 能 出 什么 问题 ? 事实 上 有 不 少 。 但 本 书 不 是 关于 makefile 的 , 所 以 我 只 会 讨论 最 稼 见 
的 错误 。 下 面 这 两 个 错误 是 我 犯 得 最 多 的 。 

口 makefile 里 的 空格 。makefile 极 其 挑 别 ， 虽 然 肉 眼看 不 见 , 但 是 makefile 里 每 个 缩 进行 都 应 
该 以 一 个 制 表 符 开 涉 ( 除了 连续 行 ， 也 就 是 它 的 前 一 行 以 一 个 \ 字 符 结尾 )。 如 果 此 人 处 有 
空格 ，make 就 会 被 干扰 ， 导 致 错误 出 现 。 

口 Erlang 文 件 缺 失 。 如 采 MODS 里 声明 的 某 一 个 模块 不 存在 ， 就 会 得 到 错误 消息 。 举 个 例子 ， 
假设 M0DS 包 含 一 个 名 为 gtlurk 的 模块 , 但 代码 目录 里 不 存在 名 为 9lurk.erl 的 文件 。 在 这 
种 情况 下 ，make 就 会 出 错 并 给 出 下 面 的 消息 : 
$ make 


make: **+* NO rule to make target ‘glurk,.beam', 
needed by compile'. Stop. 


另 一 种 情况 是 模块 存在 ， 但 makefile 里 的 模块 名 有 拼写 错误 。 0 


10.4.5” Erlang 月 江 而 你 想 阅 读 故 障 转 储 文件 


如 果 Erlang 崩 演 了 ， 它 会 留 下 一 个 名 为 erl crash.dump 的 文件 。 这 个 文件 的 内 容 也 许 能 提 
示 你 问题 出 在 哪里 。 有 一 个 基于 Web 的 故障 分 析 需 可 以 用 来 分 析 故 障 转 储 文件 。 要 局 动 这 个 分 析 
般 ， 请 输入 以 下 命令 : 

1> crashdump_viewer:start(). 

WebTool is available at http://localhost:8888/ 


Or http://127.0.0.,1:8888/ 
ok 


























然后 把 浏览 器 指向 http://localhost:8888/， 这 样 就 可 以 愉快 地 浏览 错误 日 志 了 。 
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10.5 “获取 帮助 
在 Unix 系 统 里 ， 可 以 用 下 面 的 方式 访问 手册 页 : 


$ erl -man erl 
NAME 
erl - The Erlang Emulator 


DESCRIPTION 

The erl program starts the Erlang runtime system. 

The exact details (e.g. whether erl is a script 

or a program and which other programs it calls) are system-dependent. 


还 可 以 用 下 面 的 方式 获取 各 个 模块 的 帮助 信息 : 


$ erL -man lists 
MODULE 
lists - List Processing Functions 


DESCRIPTION 


This module contains functions for list processing. 
The functions are organized in two groups: 


注意 ”Unix 系统 默认 是 不 安装 手册 页 的 。 如 果 命 令 erl -man .. .无 效 ， 就 需要 安装 手册 页 。 所 
有 的 手册 页 都 存放 在 一 个 单独 的 压缩 包 里 "。 这 些 手册 页 局 应 当 被 解压 到 Erlang 的 安装 根 目 
录 中 (通常 是 /usr/LocaL/LibyertLang )。 


还 有 一 组 HTML 文件 形式 的 文档 可 供 下 载 。 这 些 HIMIL 文 梢 在 Windows 下 是 吏 认 安 竣 的， 可 
通过 开始 荣 单 里 的 Erlang 条 目 访 问 。 


10.6 ”调节 运行 环境 


Erlang shell 有 许多 内 置 命令 。 可 以 通过 shell 命 令 help() 进 行 查看 。 





1> help(). 

** shell internal commands ** 

b() -- display all variable bindings 

e (N) -- repeat the expression in query <N> 
f() -- forget all variable bindings 

f (X) -- forget the binding of variable X 
h() -- history 


GD http:/www.erlang.org/download.html 
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所 有 这 些 命令 都 定义 在 sheLt default 模块 里 。 
如 果 想 定义 自己 的 命令 ， 只 需 创 建 一 个 名 为 user_ defautLt 的 模块 即 可 。 这 里 有 一 个 例子 : 





user default.erl 


-module(user default). 
-compile(export all). 


hello() -> 
"Hello Joe how are you?". 


away (Time) -> 
i0:format("Joe I5 away and will be back In ~w Minutes~n", 
[Time}). 


当 编 译 它 并 将 它 放 置 在 载 人 路 径 的 某 个 地 方 后 ， 就 可 以 不 带 模块 名 调用 user_ default 里 的 
任意 函数 了 。 


1> heLLo( ) ， 

"Hello Joe how are you?" 

2> away (10). 

Joe 1s away and will be back in 10 minutes 
ok 


掌握 了 详细 的 具体 知识 后 ， 可 以 来 看 看 并 发 程序 了 。 这 才 是 真正 有 意思 的 部 分 。 


10.7 练习 


创建 一 个 新 日 录 ， 人 然后 把 本 草 的 makefile 模 板 复 制 进 去 。 编 写 一 个 Erlang 小 程序 并 把 它 保存 
在 此 目录 中 。 给 makefile 和 Erlang 代 人 码 添加 一 些 命令 ， 让 它们 在 你 在 输入 make 后 能 目 动 运行 一 组 
单元 测试 ( 参见 4.1.3 节 )。 











并 发 和 分 布 式 程序 


这 一 部 分 将 介绍 并 发 和 分 布 式 Erlang。 以 顺序 
Erlang 为 基础 ， 你 将 学 会 如 何 编写 并 发 程序 ， 并 在 
分 布 式 的 计算 机 网 络 中 运行 它们 。 








现实 世界 中 的 并 发 








让 我 们 暂时 起 却 编程 ， 思 考 一 下 现实 世界 里 发 生 着 什么 。 





@ 我 们 理解 并 发 。 

我 们 的 大 脑 天 生 就 对 并 发 有 着 座 刻 的 理解 .大 脑 里 一 个 名 为 查 仁 核 的 区 域 让 我 们 能 迅速 对 刺 
激 作 出 反应 。 如 果 没 有 这 种 反应 ， 我 们 就 会 死亡 。 意 识 思维 实在 是 太 慢 了 上 ， 当 “ 踩 下 刹车 ”这 个 
念头 形成 时 ， 我 们 已 经 这 么 做 了 。 

当 我 们 驾车 行驶 在 主干 道上 , 脑子 里 会 时 刻 定位 痢 数 十 甚至 数 百 辆 车 。 这 是 在 没有 意识 思维 
参与 的 情况 下 做 到 的 。 如 果 我 们 做 不 到 这 一 点 ， 多 半 就 没命 了 。 

@ 世界 是 并 行 的 。 

如 果 我 们 想 让 编写 的 程序 有 看 现实 世界 里 其 他 对 象 的 行为 ， 这 些 程序 就 会 是 并 发 架构 的 。 

这 就 是 我 们 应 该 用 并 发 编程 语言 来 编写 程序 的 原因 。 

然而 ,我 们 经 和 营 用 顺序 编程 语言 来 编写 现实 世界 里 的 应 用 程序 .这样 做 会 市 来 不 必要 的 困难 。 
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如 果 使 用 一 种 为 编写 并 发 应 用 程序 而 设计 的 语言 ， 进 行 并 发 开发 就 会 简单 得 多 。 

@ Erlang 程 序 反 映 了 我 们 思考 和 交流 和 方式 。 

我 们 没有 共享 “内 存 ”( 也 就 是 记忆 )。 我 有 我 的 记忆 ， 你 有 你 的 记忆 。 我 们 各 有 一 个 大 脑 ， 
它们 并 不 相连 。 为 了 改变 你 的 记忆 ， 我 会 加 你 发 送 一 个 消息 : 通过 说 话 ， 或 者 挥舞 手臂 。 

你 倾听 ， 观 察 ， 然 后 改变 了 记忆 。 但 是 ， 如 果 不 问 你 问题 或 者 观察 你 的 反应 ， 我 就 无 法 知道 
你 是 否 收 到 了 我 的 消息 。 

这 就 是 Erlang 进 程 的 工作 方式 。Erlang 进 程 没 有 共享 内 存 ， 每 个 进程 都 有 它 目 己 的 内 存 。 要 
改变 其 他 某 个 进程 的 内 存 ， 必 须 回 它 发 送 一 个 消息 ， 并 祈祷 它 能 收 到 并 理解 这 个 消息 。 

要 确定 另 一 进程 收 到 了 你 的 消息 并 改变 了 它 的 内 存 ， 就 必须 询问 它 〈 通 过 回 它 发 送 一 条 消 
县 )。 这 就 是 我 们 的 交流 方式 。 


苏 : 嗨 比尔， 我 的 电话 号 码 是 345-678-1234。 
区: 你 听 到 了 吗 ? 
比尔 : 是 的 ， 你 的 电话 是 345-678-1234。 


这 些 交 流 模式 都 是 你 我 所 熟知 的 。 我 们 从 出 生起 就 逐渐 学 会 了 如 何 与 世界 交互 ,就 是 观察 它 ， 
回 它 发 送 消息 并 观察 回应 。 

@ 人 类 表现 为 独立 的 个 体 ， 通 过 发 送 消息 进行 交流 。 

这 就 是 Erlang 进 程 的 工作 方式 ， 也 是 我 们 的 工作 方式 ， 因 此 要 理解 Erlang 程 序 很 容易 。 

一 个 Erlang 程 序 会 包含 几 十 、 几 千 、 甚 至 几 十 万 个 小 进程 。 所 有 这 些 进 程 都 是 独立 运作 的 。 
它们 通过 发 送 消息 来 相互 交流 。 每 个 进程 都 拥有 一 块 私有 内 存 区 域 。 它 们 表现 得 束 像 是 一 大 群 人 
在 一 个 巨大 的 房间 里 喉 唆 不休。 

这 使 得 Erlang 程 序 天 生 易 于 管理 和 扩展 。 假 设 我 们 有 10 个 人 《进程 )， 而 他 们 有 太 多 的 工作 
要 做 , 我 们 可 以 怎么 办 ? 找 更 多 的 人 过 来 。 我 们 要 如 何 管理 这 群 人 ?7 很 简单 一 一 大 声 把 命令 告诉 
他 们 (广播) 就 可 以 了 。 

Erlang 进 程 不 共享 内 存 ， 因 此 使 用 内 存 时 无 需 加 锁 。 有 人 锁 的 地 方 就 会 有 钥匙 ， 而 钥匙 是 容易 
丢失 的 。 当 你 丢 了 钥匙 会 发 生 什 么 ? 你 会 居 慨 得 不 知 所 措 。 当 你 在 软件 系统 里 丢 了 钥匙 ， 使 锁 出 
现 问题 时 也 会 如 此 。 

分 布 式 软件 系统 里 只 要 有 锁 和 钥匙 ， 就 总 会 出 问题 。 

Erlang 没 有 锁 ， 也 没有 钥匙 。 

@ 如 果 有 人 死亡 ， 其 他 人 会 注意 到 。 

如 采 我 在 一 个 房间 里 突然 倒 下 死去 ,很 可 能 就 会 有 人 注意 到 ( 好 吧 , 至 少 我 希望 如 此 ), Erlang 
进程 就 像 人 类 一 样 ， 有 时 会 死去 。 但 和 人 类 不 同 的 是 ， 当 它们 死亡 时 , 会 用 尽 最 后 一 口气 喊 出 导 
致 它们 死亡 的 准确 原因 。 

想象 一 个 挤 满 人 的 房间 里 突然 有 一 个 人 倒 下 死去 。 就 在 那 一 刻 ， 他 说 “我 的 心脏 病 发 作 了 ” 
或 者 “我 吃 得 太 多 ， 胃 焊 炸 了 ”。Erlang 进 程 就 是 这 么 做 的 。 一 个 进程 可 能 会 在 临 死 时 说 :“ 我 是 
因为 有 人 要 求 我 除 以 零 而 死 的 。 另 一 个 可 能 会 说 :“ 我 是 因为 有 人 问 我 空 列表 的 最 后 一 个 元 素 是 




































































_ 144 第 H 齐 现实 志 界 中 的 并 发 


什么 而 死 的 。 

现在 , 在 这 个 挤 满 人 的 房间 里 , 我 们 可 以 设想 有 些 人 被 特别 指派 从 事 清理 尸体 的 工作 。 让 我 
们 假设 有 简 和 约翰 两 个 人 。 如 采 人 简 死 了 , 约 博 会 处 理 一 切 与 人 简 的 死亡 有 关 的 问题 。 如 果 约 畏 死 了 ， 
傈 会 处 理 这 些 问题 ,人 徇 和 约 鞭 通过 一 种 不 可 见 的 约定 连接 在 一 起 ,这 个 约定 是 如 果 其 中 一 人 死亡 ， 
另 一 人 就 会 处 理 一 切 由 此 产生 的 问题 。 

Erlang 的 错误 检测 正 是 使 用 的 这 种 方式 。 进 程 可 以 相互 连接 。 如 果 其 中 一 个 进程 挂 了 ， 为 一 
个 进程 就 会 得 到 一 个 说 明 前 者 死亡 原因 的 错误 消息 。 

大 致 就 是 这 人 么 一 回 事 。 

Erlang 程 序 就 是 这 人 么 工作 的 。 

到 目前 为 止 ， 我 们 学 到 的 以 下 内 容 。 

口 Erlang 程 序 由 大 量 进程 组 成 。 这 些 进 程 则 能 相互 发 送 消 息 。 

口 这 些 消 息 也 许 能 被 其 他 进程 收 到 和 理解 ， 也 许 不 能 。 如 采 想 知道 某 个 消息 是 否 已 被 对 方 

进程 收 到 和 理解 ， 就 必须 问 该 进程 发 送 一 个 消 朋 并 等 待 回 复 。 
口 进程 可 以 成 对 相互 连接 。 如 采 某 一 对 互 过 进 程 的 其 中 一 个 挂 了 ， 男 一 个 进程 就 会 收 到 一 
个 说 明 前 者 死亡 原因 的 消息 。 

这 个 简单 的 编程 模型 是 一 个 大 模型 的 一 部 分 ， 我 把 这 个 大 模型 称 为 面向 并 发 编程 
( concurrency-oriented programming )。 

在 下 一 和 草 里 ， 我 们 将 开始 编写 并 发 程序 。 我 们 需要 学 习 三 个 新 的 基本 曙 数 : spawn、send 
(使 用 ! 操 作 符 ) 和 receive。 然 后 就 能 编写 一 些 简 单 的 并 发 程序 了 。 

如 果 一 个 进程 挂 了 ， 男 一 个 进程 ( 如 采 与 前 者 相连 的 话 ) 就 会 注意 到 。 这 是 第 13 章 的 主题 。 

在 阅读 后 面 这 两 童 的 过 程 中 , 可 以 联想 一 下 房间 里 的 人 。 人 残 是 进程 。 房 间 里 的 人 都 有 他 们 
的 私人 记忆 ， 进 程 也 是 如 此 。 要 改变 你 的 记忆 ， 就 需要 我 说 给 你 昕 。 这 就 是 发 送 和 接收 消 恩 。 我 
们 有 了 小 了 该， 这 就 是 分 裂 ( spawn )。 我 们 死 了 ， 就 是 进程 退出 。 
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了 解 顺 序 Erlang 后 ， 编 写 并 发 程序 就 很 简单 了 。 只 需要 三 个 新 的 基本 吗 数 : spawn、send 和 
receive。spawn 创 建 一 个 并 行进 程 ，send 癌 某 个 进程 发 送 消 息 ，receive 则 是 接收 消息 。 

Erlang 的 并 发 是 基于 进程 (process ) 的 。 进 程 是 一 些 独立 的 小 型 虚拟 机 ， 可 以 执行 Erlang 

你 肯定 曾经 接触 过 进程 ， 但 仅仅 是 在 操作 系统 的 上 下 文 环境 里 。 在 Erlang 里 ， 进 程 录 属于 编 
程 语言 ， 而 非 操作 系统 。 这 就 意味 着 Erlang 的 进程 在 任何 操作 系统 上 都 会 具有 相同 的 逻辑 行为 ， 
这 样 ， 就 能 编写 可 移植 的 并 发 代码 ， 让 它 在 任何 支持 Erlang 的 操作 系统 上 运行 。 

在 Erlang 里 : 

口 创建 和 销毁 进程 是 非常 快速 的 ; 

口 在 进程 间 发 送 消 息 是 非常 快速 的 ; 

口 进程 在 所 有 操作 系统 上 都 具有 相同 的 行为 方式 ; 

口 可 以 拥有 大 量 进 程 ; 

口 进程 不 共享 任何 内 存 ， 是 完全 独立 的 ; 

口 进程 唯一 的 交互 方式 就 是 消息 传递 。 

出 于 这 些 原 因 ，Erlang 有 时 会 被 称 为 是 一 种 纯 消 息 传递 式 语言 。 

如 果 你 没有 进程 编程 的 经 验 , 可 能 听 说 过 它 很 有 难度 的 传言 。 你 多 半 听 过 一 些 妃 怖 故事 , 涉 
及 内 存 神 突 、 葛 争 状况 、 共 孚 内 存 破 坏 ， 等 等 。 但 在 Erlang 里 ， 进 程 编 程 是 很 徐 单 的 。 


12.1 基本 并 发 函数 
我 们 在 顺序 编程 里 学 到 的 知识 同样 适用 于 并 发 编程 。 要 做 的 只 是 加 上 下 面 这 几 个 基本 函数 。 



































@ Pid = spawn(Mod, Func, Args) 
创建 一 个 新 的 并 发 进程 来 执行 apply (Mod，Func,， Args)。 这 个 新 进程 和 调用 进程 并 列 运 
行 。spawn 返 回 一 个 Pid (process identifier 的 价 称 ， 即 进程 标识 符 )。 可 以 用 Pid 来 给 此 进 
程 发 送 消息 。 请 注意 ， 元 数 为 Length(Args) 的 Func 函 数 必须 从 Mod 模 块 导 出 。 
当 一 个 新 进程 被 创建 后 ， 会 使 用 最 新 版 的 代码 定义 模块 。 
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@ Pid= spawn(Fun) 
创建 一 个 新 的 并 发 进程 来 执行 Fun() 。 这 种 形式 的 spawn 总 是 使 用 被 执行 fn 的 当前 值 ， 而 
且 这 个 fun 无 需 从 模块 里 导出 。 
这 两 种 spawn 形 式 的 本 质 区 别 与 动态 代码 升级 有 关 。12.8 节 会 讨论 如 何 从 这 两 种 spawn 形 
式 中 做 出 选择 。 





@ Pid! Message 
问 标 识 符 为 Pid 的 进程 发 送 消息 Message。 消 息 发 送 是 异步 的 。 发 送 方 并 不 等 待 ， 而 是 会 
继续 之 前 的 工作 。! 被 称 为 发 送 操作 符 。 








Pid ! M 被 定义 为 M。 因 此 ，Pid1l ! Pid2 !...! Msg 的 意思 是 把 消息 Msg 发 送 给 Pid1、 
Pid2 等 所 有 进程 。 


@ recelve ... end 


接收 发 送 给 某 个 进程 的 消息 。 它 的 语法 如 下 : 


receive 
Patternl [when Guardl] -> 
Expressions1,; 
Pattern2 [when Guard2] -> 
Expressions2; 
end 


当 某 个 消息 到 达 进 程 后 ， 系 统 会 尝试 将 它 与 Pattern1l (以 及 可 选 的 关卡 Guard1l ) 匹配 ， 
如 果 成 功 就 执行 Expressions1。 如 果 第 一 个 模式 不 匹配 , 就 会 尝试 Pattern2, 以 此 类 推 。 
如 果 没 有 匹配 的 模式 ， 消 息 就 会 被 保存 起 来 供 以 后 处 理 ， 进 程 则 会 开始 等 竺 下 一 条 消息 。 
12.$ 节 中 会 介绍 更 多 的 细节 。 
接收 语句 里 的 模式 和 关卡 和 我 们 定义 函数 时 使 用 的 模式 和 关卡 具有 相同 的 语法 形式 和 
Ts 
好 了 ， 就 是 这 些 。 不 需要 线程 、 锁 、 信 号 和 人 工控 制 。 
到 目前 为 止 , 我 们 粗略 介绍 了 人 spawn、send 和 receive 的 工作 方式 。 当 spawn 命 令 被 执行 时 ， 
系统 会 创建 一 个 新 的 进程 。 每 个 进程 都 帘 有 一 个 邮箱 ， 这 个 邮箱 是 和 进程 同步 创建 的 。 
给 某 个 进程 发 送 消息 后 , 消息 会 被 放 入 该 进程 的 邮箱 。 只 有 当 程 序 执行 一 条 接收 语句 时 才 会 
读 取 邮箱 。 
通过 这 三 个 基本 困 数 ， 我 们 可 以 把 4.1 节 里 的 area/1 函 数 转 变 为 一 个 进程 。 提 醒 一 下 ， 定 义 
area/1 卫 数 的 代码 如 下 : 














geometry.erl 


area({rectangle, Width, Height}) -> Width * Height; 
area({square, Side}) -> Side * Side. 
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现在 把 这 个 函数 改写 成 一 个 进程 。 为 此 ， 我 们 从 area 冰 数 的 参数 里 取 了 两 个 模式 ， 然 后 把 
它们 重 置 为 接收 语句 里 的 模式 。 


area server0.erl 


-module(area server0). 
-export([Lloop/0]). 


loop() -> 
recelive 
{rectangle, Width, Ht} -> 
io:format("Area of rectangle is ~p~n", [Width * Ht]), 
loop (); 
{square, Side} -> 
io:format("Area of square is ~p~n", [Side * Side]), 
loop() 
end. 


可 以 在 shell 里 创建 一 个 执行 Loop/0 的 进程 。 


1> Pid = spawn(area server0, loop, []). 
<0O ,36.0> 

2> Pid ! {rectangle, 6, 10}. 

Area of rectangle is 60 
{rectangle,6,10} 

3> Pid ! {square, 12}. 

Area of square is 144 

{square, 144} 


我 们 在 第 1 行 里 创建 了 一 个 新 的 并 行进 程 。spawn (area server，Loop，[]) 会 创建 一 个 执 
行 area server:Loop() 的 并 行进 程 ， 然 后 返回 Pid， 也 就 是 打印 出 来 的 <0.36.0>。 
在 第 2 行 里 问 这 个 进程 发 送 了 一 个 消息 。 这 个 消息 匹配 Loop/0 接 收 语 句 里 的 第 一 个 模式 : 
loop() -> 
receive 
{rectangle, Width, Ht} -> 


io:format("Area of rectangle is ~p~n",[Width * Ht]), 
loop() 


收 到 消息 之 后 ， 这 个 进程 打印 出 和 矩形 的 面积 。 最 后 ，shell 打 Eh 出 {rectangle,，6，10},， 这 
是 因为 Pid ! Msg 的 值 被 定义 为 Msg。 





12.2 ”客户 端 - 服 务 器 介绍 


客户 闯 - 服 务 胡 架构 是 Erlang 的 中 心 。 传 统 的 客户 疾 - 服 务 囊 如 构 是 指 一 个 分 隔 客户 闪 与 服务 
何 的 网 络 。 大 多 效 情况 下 客户 端 会 有 多 个 实例 ， 而 服务 郁 只 有 一 个 。 服 务 器 这 个 词 经 常会 让 人 联 
想到 专业 机 带 上 运行 重量 级 软件 的 画面 。 
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我 们 的 实现 机 制 则 要 轻 量 得 多 。 客 户 问 -服务 从 染 构 里 的 客 尸 端 和 服务 具 是 不 同 的 进程 ， 它 
们 之 间 的 通信 使 用 普通 的 Erlang 消 息 传 递 机 制 。 客 户 端 和 服务 胡可 以 运行 在 同一 人 台 机 天 上 ， 也 可 
以 运行 在 不 同 的 机 入 上 。 

客户 端 和 服务 器 这 两 个 词 是 指 这 两 种 进程 所 扮演 的 角色 :客户 病 总 是 通过 四 服务 珊 发 送 一 个 
请 求 来 发 起 计算 。 服 务 带 计算 后 生成 回复 ， 然 后 发 送 一 个 响应 给 客户 端 。 

下 面 来 编写 我 们 的 第 一 个 客户 端 - 服 务 胡 应 用 程序 。 首 和 完 ， 对 上 一 市 里 编写 的 程序 做 一 些小 
小 的 修改 。 

在 上 一 个 程序 里 , 我 们 只 需要 问 某 个 进程 发 送 请 求 ,然后 接收 它 并 打印 出 来 。 现 在 要 做 的 是 
问 发 送 原 请 求 的 进程 发 送 一 个 啊 应 。 问 题 是 ,我 们 不 知道 该 把 响应 发 给 谁 。 要 发 送 一 个 啊 应 ， 客 
户 问 必须 加 入 一 个 服务 带 可 以 回复 的 地 址 。 这 就 像 是 给 菜 人 写 信 一 一 如 来 你 想得到 回复 , 最 好 把 
你 的 地 址 写 在 信 中 | 

此 ， 发 送 方 必须 加 入 一 个 回复 地 址 。 要 做 到 这 一 点 ， 可 以 把 : 


Pid ! {rectangle, 6, 10} 

修改 成 下 面 这 样 : 

Pid ! {self(), {rectangle, 6, 10}} 

self() 是 客户 问 进 程 的 标识 符 。 

为 了 响应 请 求 ， 我 们 必须 把 接收 请 求 的 代码 从 : 


loop() -> 
receive 
{rectangle, Width, Ht} -> 
lio:format("Area of rectangle 1s ~p~n", [Width * Ht]), 
loop() 


























修改 成 下 面 这 样 : 
loop() -> 
receive 
{From, {rectangle, Width, Ht}} -> 
From ! Width * Ht, 
Loop(); 


请 注意 我 们 是 如 何 把 计算 结果 发 回 由 From 参 数 指定 的 进程 的 。 因 为 客户 问 把 这 个 参数 设置 
成 它 自 己 的 ID ， 所 以 能 收 到 结 

发 送 请 求 的 进程 通常 称 为 客户 端 。 接 收 请 求 并 回复 客户 端的 进程 称 为 服务 器 。 

另外 , 最 佳 实践 是 确认 发 送 给 进程 的 每 一 个 消息 都 已 收 到 。 如 采 发 送 给 进程 的 消息 不 匹配 原 
始 接收 语句 里 的 任何 一 个 模式 ， 这 条 消息 就 会 遗留 在 进程 邮箱 里 , 永远 无 法 接收 。 为 了 解决 这 个 
问题 ， 我 们 在 接收 霹 句 的 最 后 加 了 一 个 子 句 ， 让 它 能 匹配 所 有 发 送 给 此 进程 的 消息 。 

最 后 ， 添 加 一 个 名 为 rpc (remote procedure call 的 缩写 ， 即 远程 过 程 调 用 ) 的 实用 小 机 数 ， 

















它 封 闻 了 回 服务 从 发 送 请 求 和 等 待 啊 应 的 代码 。 


area_server1.er| 
rpc (Pid, Request) -> 
Pid ! {self(), Request}, 
receive 
Response -> 
Response 
end. 


把 所 有 这 些 合并 到 一 起 ， 得 到 了 下 面 的 代码 : 





area_Sserver1.er| 


-module(area serverl). 
-export([loop/90, rpc/21). 
rpc(Pid, Request) -> 
Pid ! {self(), Request}, 
receive 
Response -> 
Response 
end. 
loop() -> 
receive 
{From, {rectangle, Width, Ht}} -> 
From ! Width * Ht, 
Loop(); 
{From, {circle, R}} -> 
From ! 3.14159 * R * R, 
Loop(); 
{From, Other} -> 
From ! {error,0Othert}, 
loop() 
end. 


可 以 在 shell 里 试验 一 下 它 。 


1> Pid = spawn(area serverl, loop, []). 

<0 .36.0> 

2> area serverl:rpc(Pid, {rectangle,6,8}). 
48 


3> area serverl:rpc(Pid, {circle,6}). 
113.097 12 
4> area serverl:rpc(Pid, socks). 
{error,socks} 
这 上 段 代码 有 个 小 问题 。 在 rpc/2 痕 数 里 ， 我 们 回 服务 需 发 送 请 求 然后 等 待 啊 应 。 但 我 们 并 不 
是 等 竺 来 目 服 务 豆 的 啊 应 ,而 是 在 等 竺 任意 消息 。 如 果 其 他 某 个 进程 在 客户 端 等 竺 来 目 服 务 需 的 


消息 时 间 它 发 送 了 一 个 消息 , 客户 闹 人 ,错误 解读 为 来 目 服 务 融 的 啊 应 。 要 纠正 这 个 问 
磺 ， 可 以 把 接收 语句 的 形式 修改 如 下 : 
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loop() -> 
receive 
{From, ...} -> 
From ! {self{()}, ...} 
loop() 
end. 
青 把 rpc 修 改 如 下 : 


rpc(Pid, Request) -> 
Pid ! {self{()}, Request}, 
receive 
{Pid, Response} -> 
Response 
end. 


调用 rpc 国 数 时 ，Pid 会 被 绑 定 为 革 个 值 ， 因 此 {fPid，Response} 这 个 模式 里 的 Pid 已 绑 定 ， 
而 Response 未 绑 定 。 这 个 模式 只 会 匹配 包含 一 个 双 元 素 元 组 (第 一 个 元 系 是 Pid ) 的 消息 。 所 有 
别 的 消息 都 会 进入 队列 。( receive 提 供 了 选择 性 接收 的 功能 ， 我 会 在 后 面 介 绍 。) 修改 之 后 的 代 
体 如 下 : 








area server2.erl 


-module(area server2). 
-export([loop/0, rpc/21). 
rpc(Pid, Request) -> 

Pid ! {self(), Request}, 


receive 
{Pid, Response} -> 
Response 
end. 
loop() -> 
receive 


{From, {rectangle, Width, Ht}} -> 
From ! {self()}, Width * Ht}, 
Loop(); 

{From, {circle, R+} -> 
From ! {self(}, 3.14159 * R * R}, 
Loop(); 

{From, Other} -> 
From ! {self(), {error,other}}, 
Loop 

end . 


它 的 工作 方式 和 预期 的 一 致 。 


1> Pid = spawn(area server2, loop, []). 
<0O .37.0> 

2> area server2:rpc(Pid, {circle, 5}). 
78.5397 
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还 有 最 后 一 点 可 改进 的 地 方 ,我 们 可 以 让 spawn 和 rpc 隐 藏 在 模块 内 ,请 注意 ,还 需要 把 spawn 
的 参数 ( 也 就 是 Loop/9 ) 从 模块 中 导出 。 这 是 一 种 好 的 做 法 ， 因 为 它 能 让 我 们 在 不 改变 客户 端 
代码 的 情况 下 修改 服务 融 的 内 部 细节 。 最 终 的 代码 如 下 : 


area server final.erl 





-module(area server final). 
-export([start/0, area/2, loop/90]). 


start() -> spawn(area server final, loop, [|]). 


area(Pid, What)} -> 
rpc(Pid, What). 
rpc(Pid, Request) -> 
Pid ! {self(), Request}, 


receive 
{Pid, Response} -> 
Response 
end. 
loop() -> 
receive 


{From, {rectangle, Width, Ht}} -> 
From ! {self()}, Width * Ht}, 
loop0),; 

{From, {circle, R}} -> 
From ! {self{(}, 3.14159 * R +* R}, 
Loop 人 

{From, Other} -> 
From ! {self()}, {error,Other}}, 
Loop() 

end. 


我 们 调用 函数 start/0 和 area/2 (之 前 称 为 spawn 和 rpc ) 来 运行 它 。 这 些 新 名 称 更 好 一 些 ， 
因为 它们 能 更 准确 地 摘 述 服务 硕 的 行为 。 

1> Pid = area server finalL:start() ， 

<0O ,36.0> 

2> area server final:area(Pid, {rectangle, 10, 8}). 

80 


3> area server final:area(Pid, {circle, 4}). 
50 .2654 


这 样 就 完成 了 一 个 简单 的 客户 端 -服务 器 模 决 。 所 需要 的 就 是 三 个 基本 函数 ; spaun、send 和 村 对 
receive。 这 种 模式 会 以 各 类 变种 的 形式 不 断 重 复出 现 , 变化 虽然 可 大 可 小 , 但 基本 的 概念 是 不 变 的 。 
12.3 ”进程 很 轻巧 


在 这 个 阶段 ， 你 可 能 会 担心 性 能 问题 。 毕 竞 ， 如 果 创 建 数 百 或 者 数 千 个 Erlang 进 程 ， 就 必须 
付出 一 定 的 代价 。 让 我 们 来 看 看 代价 有 和 多大。 
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我 们 将 执行 一 些 分 裂 操作 ,创建 大 量 的 进程 , 并 计算 要 花费 多 长 时 间 。 下 面 是 一 个 程序 ,请 
注意 在 这 里 用 的 是 spawn (Fun)， 并 且 被 分 裂 出 的 函数 并 不 需要 从 模块 里 导出 : 





processes.erl 


-module(processes). 
-exportt{( [max/1]). 
%% Max(N) 


%% 创建 N 个 进程 然后 销毁 它们 
%% 看 看 需要 花费 多 长 时 间 


max{N) -> 
Max = erlang:system info(process limit), 
io:format ("Maximum allowed processes:~p~n", [Max|]), 
statistics (runtime), 
statistics (wall clock), 
= for(1l, N, fun() -> spawn(fun() -> wait() end) end), 
{ ,， Timel} = statistics (runtime), 
{ ，Time2} = statistics (wall clock), 
lists:foreach(fun(Pid) -> Pid ! die end, 1), 
Ul = Timel * 1000 / N， 
U2 = Time2 * 1000 / N， 
i0:format( Process spawn time=~p (~p) microseconds~n", 


[Ul, U2])., 
wait() -> 
receive 
die -> void 
end. 


for(N, N, F)} -> [F{()]; 
for(I, N, F)}) -> [F()}|for(I+1, N, F)]. 


下 面 的 结果 源 于 我 现在 所 用 的 计算 机 (2.90 GHz 的 Intel Core i7 双 核 处 理 器 ，8GB 内 存 ， 运 行 
Ubuntu 操作 系统 ): 


1> processes:max(20000). 

Maximum allowed processes:262144 

Process spawn time=3.0 (3.4) microseconds 
2> processes:max(300000). 

Maximum allowed processes:262144 





=ERROR REPORT==== 14-May-2013: :09:32:56 === 
Too many processes 


** exception error: a system limit has been reached 
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分 裂 20 000 个 进程 平均 消耗 了 3.0 微 秒 /进程 的 CPU 时 间 和 3.4 微 秒 /进程 的 实际 运行 时 间 。 

请 注意 我 使 用 了 内 置 岗 数 erlang:system info(process_limit) 来 找 出 所 允许 的 最 大 进 
程 数量 。 其 中 有 一 些 是 系统 保留 的 进程 ， 所 以 你 的 程序 实际 上 不 能 用 那么 多 。 当 超出 限制 值 时 ， 
系统 会 拒绝 启动 更 多 的 进程 并 生成 一 个 错误 报告 ( 见 第 2 个 命令 )。 

系统 内 设 的 限制 值 是 262 144 个 进程 ,要 超越 这 一 限制 ,必须 用 +P 标 识 启 动 Erlang 仿 真 器 如 下 : 

$ erl +P 3000000 

1> processes:max(S500000). 

Maximum allowed processes:4194304 

Process spawn time=2.52 (2.896) microseconds 

ok 

2> processes:max(1000000). 

Maximum allowed processes:4194304 

Process Spawn time=3.65 (4.095) microseconds 

ok 

3> processes:max(2000000). 

Maximum allowed processes:4194304 

Process spawn time=4.02 (8.0625) microseconds 

ok 

6> processes:max(3000000). 

Maximum allowed processes:4194304 

Process Spawn time=4.048 (8.624) microseconds 

ok 


在 前 面 的 例子 里 ， 系 统 实际 选择 的 值 是 恰好 大 于 参数 的 2 的 需 。 这 个 实际 值 可 以 通过 调用 
erLang:system info(process Limit) 获 得 。 我 们 可 以 看 到 ， 随 着 进程 数量 的 增加 ， 进 程 分 裂 
时 间 也 在 增加 。 如 果 继 续 增 加 进程 的 数量 ， 最 终 会 耗 尽 物理 内 存 ， 导 致 系统 开始 把 物理 内 存 交 换 
到 人 硬盘 上 ， 运 行 速度 明显 变 慢 。 

如 果 你 编写 的 程序 需要 使 用 大 量 进程 ,最 好 先 搞 清楚 物理 内 存在 交换 到 硬盘 之 前 能 容纳 多 少 
进程 ， 并 且 确 保 程序 运行 在 物理 内 存 中 。 

如 你 所 见 ， 创 建 大 量 进 程 的 速度 是 很 快 的 。 如 果 你 是 一 名 C 或 Java 程 序 员 ， 也 许 会 不 敢 使 用 
大 量 的 进程 ， 而 且 必 须 负 责 管理 它们 。 而 在 Erlang 里 ， 创 建 进程 让 编程 变 得 更 简单 ， 而 不 是 更 
复 洒 。 


12.4 市 超时 的 接收 


有 时 候 一 条 接收 语句 会 因为 消息 迟 迟 不 来 而 一 直 等 下 去 。 发 生 这 种 情况 的 原因 有 很 多 ， 比 如 
程序 里 可 能 有 一 处 逻辑 错误 ,或 者 准备 发 送 消 息 的 进程 在 消息 发 出 前 就 月 沉 了 ,要 避免 这 个 问题 ， 
可 以 给 接收 语句 增加 一 个 超时 设置 ， 设 定 进 程 等 待 接收 消息 的 最 长 时 间 。 它 的 霹 法 如 下 : 

receive 


Pattern1l [when Guardl] -> 
Expressions1l,; 
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Pattern2 [when Guard2] -> 
Expressions2,; 


after Time -> 
Expressions 
end 


如 采 在 进入 接收 表达 陈 的 Time 有 这 秒 后 还 没有 收 到 匹配 的 消息 ， 进 程 就 会 俘 止 等 待 消 县 ， 转 
而 执行 Expressions。 
12.4.1 只 市 超时 的 接收 


可 以 编写 一 个 只 有 超时 部 分 的 receive。 通 过 这 种 方法 ,我们 可 以 定义 一 个 sLeep (T) 水 数 ， 
它 会 让 当前 的 进程 挂 起 T 蝶 秒 。 





lib_misc.erl 
sleep(T) -> 
receive 
after T -> 
true 
end. 


12.4.2 ”起 时 值 为 0 的 接收 


超时 值 为 0 会 让 超时 的 主体 部 分 立即 发 生 ， 但 在 这 之 前 ， 系 统 会 尝试 对 邮箱 里 的 消息 进行 匹 
配 。 我 们 可 以 用 它 来 定义 一 个 flush_buffer 浮 数 ， 它 会 清空 进程 邮箱 里 的 所 有 消息 。 





lib_misc.erl 
flush buffer() -> 
receive 
_Any -> 
flush buffer() 
after © -> 
true 
end. 


如 果 没 有 超时 子 句 ，flush_buffer 就 会 在 邮箱 为 空 时 永远 挂 起 日 不 返回 。 我 们 还 可 以 使 用 
零 超时 来 实现 某 种 形式 的 “优先 接收 ”， 就 像 下 面 这 样 : 


lib_misc.erl 


priority receive() -> 


receive 
{alarm, X} -> 
{alarm, XxX} 
after 0 -> 


recelive 
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end 
end. 


如 果 邮 箱 里 不 存在 匹配 {fatlarm，X} 的 消息 ，priority receive 就 会 接收 邮箱 里 的 第 一 个 
消息 。 如 采 没 有 任何 消息 ,， 它 就 会 在 最 里 面 的 接收 语句 处 挂 起 ， 并 返回 它 收 到 的 第 一 个 消息 。 如 
果 存 在 匹配 {falarm，X} 的 消息 ， 这 个 消息 就 会 被 立即 返回 。 请 记 住 ， 只 有 当 邮 箱 里 的 所 有 条 目 
都 进行 过 模式 匹配 后 ， 才 会 检查 after 部 分 。 

如 果 没 有 after 0 语句 ， 警 告 (alarm ) 消息 就 不 会 被 首先 匹配 。 





注意 ”对 大 的 邮箱 使 用 优先 接收 是 相当 低 效 的 ， 所 以 如 果 你 打算 使 用 这 一 技巧 ， 请 确保 邮箱 不 
要 太 满 。 


12.4.3 ”超时 值 为 无 穷 大 的 接收 


如 末 接 收 语 句 里 的 超时 值 是 原子 infinity ( 无穷大 )， 就 永远 不 会 触发 超时 。 这 对 那些 在 接 
收 语句 之 外 计算 超时 值 的 程序 可 能 很 用。 有 时 候 计 算 的 结 灯 是 返回 一 个 实际 的 超时 值 , 其 他 的 
时 候 则 是 让 接收 语句 永远 等 待 下 去 。 





12.4.4 ”实现 一 个 定时 器 


可 以 用 接收 超时 来 实现 一 个 简单 的 定时 器 。 
陋 数 stimer:start(Time，Fun) 会 在 Time 毫 秒 之 后 执行 Fun (一 个 不 带 参 数 的 图 数 )。 它 返 
回 一 个 句柄 ( 是 一 个 PID )， 可 以 在 需要 时 用 来 关闭 定时 器 。 








stimer.erl 


-module (stimer)., 
-export([start/2, cancel/1]). 


start(Time, Fun) -> spawn(fun() -> timer(Time, Fun) end). 
cancel (Pid) -> Pid ! cancel. 
timer(Time, Fun) -> 
receive 
cancel -> 
void 
after Time -> 
Fun() 
end, 


可 以 像 下 面 这 样 测试 它 : 


1> Pid = stimer:start(5000, fun() -> io:format("timer event~n") end). 
< .42 ,0> 
timer event 
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我 年 每 的 时 间 超 过 了 5 秒 钟 ， 这 样 定时 带 束 会 触发 。 现 在 我 将 局 动 一 个 定时 带 ， 然 后 在 到 期 
前 关闭 它 。 

2> Pidl = stimer:start(25000，fun() -> io:format("timer event~n") end ) 

<0.49.0> 


3> stimer:cancel (Pidl). 
cancel 


超时 和 定时 带 是 实现 许多 通信 协议 的 关键 。 我 们 等 竺 茶 个 消息 时 并 不 想 永远 等 下 去 , 所 以 会 
像 例子 里 那样 增加 一 个 超时 设置 。 


12.5 ”选择 性 接收 


基本 了 晒 数 receive 用 来 从 进程 邮箱 里 提取 消息 , 但 它 所 做 的 不 仅仅 是 简单 的 模式 匹配 。 它 还 
会 把 未 匹配 的 消息 加 入 队列 供 以 后 处 理 ， 并 管理 超时 。 下 面 这 个 语句 : 


recelve 
Patternl [when Guardl] -> 
EXxpressionsl; 
Pattern2 [when Guard2] -> 
Expressions2; 








after 
Time -> 
ExpressionsTimeout 
end 


它 的 工作 方式 如 下 。 
(1) 进入 receive 语 句 时 会 局 动 一 个 定时 需 〈 但 只 有 当 表 达 式 包含 after 部 分 时 才 会 如 此 )。 
(2) 取出 邮箱 里 的 第 一 个 消息 ， 尝 试 将 它 与 Patternl1、Pattern2 等 模式 匹配 。 如 果 匹 配 成 
系统 就 会 从 邮箱 中 移 除 这 个 消息 ， 并 执行 模式 后 面 的 表达 式 。 
(3) 如 果 receive 语 句 里 的 所 有 模式 都 不 匹配 邮箱 的 第 一 个 消息 ， 系 统 就 会 从 邮箱 中 移 除 这 
个 消息 并 把 它 放 和 一 个 “保存 队列 ”, 然后 继续 尝试 邮箱 里 的 第 二 个 消息 。 这 一 过 程 会 不 断 重复 ， 
直到 发 现 匹配 的 消息 或 者 邮箱 里 的 所 有 消息 都 被 检查 过 了 为 止 。 

(4) 如 采 邮 箱 里 的 所 有 消息 都 不 匹配 ， 进 程 就 会 被 挂 起 并 重新 调度 ， 直 到 新 的 消息 进入 邮箱 
才 会 继续 执行 。 新 消息 到 达 后 ,保存 队列 里 的 消息 不 会 重新 匹配 ， 只 有 新 消息 才 会 进行 匹配 。 

(3) 一 旦 某 个 消息 匹配 成 功 , 保存 队列 里 的 所 有 消息 就 会 按照 到 达 进 程 的 顺序 重新 进入 邮箱 。 
如 果 设 置 了 定时 右 ， 就 会 清除 它 。 

(6) 如 果 定 时 需 在 我 们 等 竺 消息 时 到 期 了， 系统 台 会 执行 表达 式 ExpressionsTimeout， 并 
把 所 有 保存 的 消息 按照 它们 到 达 进 程 的 顺序 重新 放 回 邮箱 。 


功 


3 
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12.6 注册 进 井 程 


如 果 想 给 一 个 进程 发 送 消息 ， 就 需要 知道 它 的 PID， 但 是 当 进 程 创建 时 ， 只 有 父 进 程 才 知道 
它 的 PID。 系 统 里 没有 其 他 进程 知道 它 的 存在 。 这 通常 很 不 方便 ， 因 为 你 必须 把 PID 发 送 给 系统 
里 所 有 想 要 和 它 通信 的 进程 。 另 一 方面 ， 这 也 很 安全 。 如 果 不 透 露 某 个 进程 的 PID ， 其 他 进程 就 
无 法 以 任何 方式 与 其 交互 。 

Erlang 有 一 种 公布 进程 标识 符 的 方法 ， 它 让 系统 里 的 任何 进程 都 能 与 该 进程 通信 。 这 样 的 进 
程 被 称 为 注册 进程 ( registered process )。 管 理 注册 进程 的 内 置 限 数 有 四 个 。 











@ register(AnAtom, Pid) 
用 AnAtom (一 个 原子 ) 作为 名 称 来 注册 进程 Pid。 如 果 AnAtom 已 被 用 于 注册 某 个 进程 ， 
这 次 注册 就 会 失败 。 





@ unregister( AnAtom) 


移 除 与 AnAtom 关 联 的 所 有 注册 信息 。 
注意 ”如果 某 个 注册 进程 前 潢 了， 就 会 自动 取消 注册 。 


@ Whereis(AnAtom) -> Pid | undefined 
检查 AnAtom 是 否 已 被 注册 。 如 果 是 就 返回 进程 标识 从 Pid， 如 果 没 有 找到 与 AnAtom 关 联 
的 进程 束 返 回 原子 undefined。 


@ registered() -> [AnAtom::atom()] 


返回 一 个 包含 系统 里 所 有 注册 进程 的 列表 。 
可 以 用 register 来 改写 12.1 节 里 的 代码 示例 ， 并 尝试 用 创建 的 进程 名 称 进 行 注册 。 


1> Pid = spawn(area server0, loop, []). 
<0.51.0> 

2> register(area, Pid). 

true 


一 旦 名 称 注册 完成 ， 就 可 以 像 这 样 给 它 发 送 消息 : 


3> area ! {rectangle, 4, 5}. 
Area of rectangle is 20 
{rectangle, 4,5} 


可 以 用 register 来 制作 一 个 模拟 时 钟 的 注册 进程 。 











clock.erl 


-module(clock). 
-export([start/2, stop/0]). 
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start(Time, Fun) -> 
register(clock, spawn(fun() -> tick(Time, Fun) end)). 
stop() -> CLOCK ! stop,., 
tick(Time, Fun) -> 
receive 
stop -> 
void 
after Time -> 
Fun(), 
tick(Time, Fun) 
end. 


这 个 时 钟 会 不 断 滴答 作 咽 ， 和 直到 你 集 止 它 。 


3> clock:start(5000, fun() -> io:format("TICK ~p~n",[erlang:now(})]) end). 
true 

TICK {1164,553538,392266} 

TICK {1164,553543,393084} 

TICK {1164,553548,394083} 

TICK {1164,553553,395064} 

4> clock:stop(). 

stop 


12.7 关于 尾 韬 归 的 说 明 
再 来 看 一 下 我 们 之 前 编写 的 面积 计算 服务 器 ， 它 的 接收 循环 如 下 : 








area_server final.erl 
loop() -> 
receive 
{From, {rectangle, Width, Ht}} -> 
From ! {self()}, Width * Ht}, 
Loop(); 
{From, {circle, R+} -> 
From ! {self(}), 3.14159 * R * R}, 
Loop0),; 
{From, Other} -> 
From ! {self()}, {error,Other}}, 
Loop() 
endj ， 


如 果 你 仔细 观察 ， 就 会 发 现 每 当 我 们 收 到 消息 时 就 会 处 理 它 并 立即 再 次 调用 Loop () 。 这 一 
过 程 被 称 为 尾 递归 (tail-recursive )。 可 以 对 一 个 尾 递 归 的 因数 进行 特别 编译 ， 把 语句 序列 里 的 最 
后 一 次 函数 调用 替换 成 跳 至 被 调用 函数 的 开头 。 这 就 意味 着 尾 递 归 的 函数 无 需 消 耗 栈 空间 也 能 一 
直 循 环 下 去 。 

假设 编写 了 以 下 (不 正确 的 ) 代码 : 
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Line1 loop() -> 
receive 
{From, {rectangle, Width, Ht}} -> 
From ! {self(), Width * Ht}, 


5 Loop(), 
SomeoOtherFunc ( ) ; 

{From, {circle, R}} -> 
From ! {self(), 3.14159 * R * R}, 
Loop(); 


end 


一 个 并 发 程序 模板 
当 我 编写 并 发 程序 上 时， 几乎 总 是 从 下 面 这 样 的 代码 起 步 . 


-module(ctemplate). 
-compile(export all). 


start() -> 
spawn(?MODULE, loop, []). 


rpc(Pid, Request) -> 
Pid ! {self(), Request}, 
receive 
{Pid, Response} -> 
Response 
end. 


loop(X) -> 
receive 
Any -> 
io:format("Received:~p~n" ,|[Any]), 
Loop (X) 
end. 
接收 循环 仅仅 是 一 个 空 循环 ， 它 会 接收 并 打印 出 任何 我 发 给 它 的 消息 。 在 开发 程序 的 过 
程 中 , 我 会 开始 向 一 些 进程 发 送 消息 。 因 为 我 一 开始 没有 给 接收 循环 添加 能 匹配 这 些 消息 的 模 
式 ， 所 以 接收 语句 底部 的 代码 就 会 把 它们 打印 出 米 。 每 到 这 个 时 候 , 我 就 会 给 接收 循环 添加 一 
个 匹配 模式 并 重新 运行 程序 。 这 一 技巧 在 相当 程度 上 决定 了 我 编写 程序 的 顺序 : 从 一 个 小 程序 
开始 ， 逐 渐 扩 展 它 ， 并 在 开发 过 程 中 不 断 进 行 测 试 。 








我 们 在 第 5 行 里 调用 了 Loop() ， 但 是 编译 器 必然 推断 出 “ 当 我 调用 Loop ( ) 后 必须 返回 这 里 ， 
因为 我 得 调用 第 6 行 里 的 some0therFunc()”。 于 是 它 把 some0therFunc 的 地 址 推 入 栈 ， 然 后 跳 
到 Loop 的 开头 。 这 人 么 做 的 问题 在 于 Loop () 是 永 不 返回 的 ， 它 会 一 直 循 环 下 去 。 所 以 ， 每 次 经 过 
第 5 行 ， 就 会 有 一 个 返回 地 址 被 推 人 控制 栈 ， 最 终 系统 的 空间 会 消耗 列 尽 。 
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避 狗 这 个 问题 的 方法 很 价 单 ， 如 果 你 编写 的 函数 F 是 永 不 返回 的 〈 就 像 Loop () 一 样 )， 就 要 
硝 你 在 调用 F 之 后 不 再 调用 其 他 任何 东西 ， 并 且 别 把 F 用 在 列表 或 元 组 构造 从 里 。 











12.8 用 MFA 或 Fun 进行 分 列 


用 显 式 的 模块 、 函 数 名 和 参数 列表 ( 称 为 MFA ) 来 分 裂 一 个 函数 是 确保 运行 进程 能 够 正确 
升级 为 新 版 模块 代码 (即使 用 中 被 再 次 编译 ) 的 恰当 方式 。 动 态 代码 升级 机 制 不 适用 于 fon 的 分 
裂 ， 只 能 用 于 带 有 显 式 名 称 的 MEA 上 。 更 多 细节 请 参阅 8.10 节 的 相关 内 容 。 

如 果 你 不 关心 动态 代码 升级 ， 或 者 确定 程序 不 会 在 未 来 进行 修改 ， 就 可 以 使 用 spawn 的 
spawn (Fun) 形 式 。 如 果 有 疑问 ， 就 使 用 spawn (MFA)。 

就 是 这 样 。 现 在 可 以 编写 并 发 程序 了 1 

接 下 来 我 们 将 关注 错误 恢复 ， 了 解 如 何 运 用 三 个 新 的 概念 ( 连接、 信号 和 捕捉 进程 退出 ) 来 
编写 容错 的 并 发 程序 。 这 正 是 下 一 章 的 主题 。 








12.9 练习 


(1) 编写 一 个 start (AnAtom，Fun) 滑 数 来 把 spawn (Fun) 注 册 为 AnAtom。 确 保 当 两 个 并 行进 
程 同时 执行 start/2 时 你 的 程序 也 能 正确 工作 。 在 这 种 情况 下 ， 必 须 保 证 其 中 一 个 进程 会 成 功 ， 
而 为 一 个 会 失败 。 

(2) 用 12.3 届 里 的 程序 在 你 的 机 如 上 测量 一 下 进程 分 裂 所 需 的 时 间 。 在 一 张 进程 数量 对 进程 
创建 时 间 的 图 上 进行 标 绘 *。 你 能 从 中 得 出 什么 推论 ? 

(3) 编写 一 个 环形 计时 测试 。 创 建 一 个 由 N 个 进程 组 成 的 环 。 把 一 个 消息 沿 着 环 发 送 M 次 ， 这 
样 总 共 发 送 的 消息 数量 是 N * M。 记 录 不 同 的 N 和 M 值 所 花费 的 时 间 。 

用 你 鸣 悉 的 其 他 编程 语言 编写 一 个 类 似 的 程序 , 然后 比较 一 下 结 采 。 写 一 篇 博客 , 把 结果 在 
网 上 发 布 出 来 ! 








OD 标 绘 是 指 在 图 上 标注 一 些 点 ， 然 后 把 它们 连接 起 来 。 一 一 译 者 注 
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相对 于 顺序 程序 ,处 理 并 发 程序 里 的 错误 涉及 一 种 完全 不 同 的 思考 方式 。 在 这 一 章 里 ,我 们 
将 根据 你 在 第 6 章 里 学 到 的 原则 ， 把 这 些 概念 延伸 到 并 发 程序 上 。 

我 们 将 介绍 错误 处 理 的 内 在 理念 ,以 及 关于 错误 是 如 何在 进程 间 传 播 和 被 其 他 进程 捕捉 的 细 
节 。 最 后 ， 用 一 些小 范例 作为 结尾 ， 它 们 是 编写 容错 式 软件 的 起 点 。 

设想 一 个 只 有 单一 顺序 进程 的 系统 。 如 来 这 个 进程 挂 了 ,麻烦 可 能 就 大 了 ,因为 没有 其 他 进 
程 能 够 帮忙 。 出 于 这 个 原因 ， 顺 序 语 言 把 重点 放 在 故障 预防 上 ， 强 调 进 行 防 御 式 编程 。 

在 Erlang 里 , 我们 有 大 量 的 进程 可 供 支 配 ， 因 此 任何 单 进程 故障 都 不 算 特 别 重 要 。 通 第 只 需 
编写 少量 的 防御 性 代码 ， 而 把 重点 放 在 编写 纠正 性 代码 上 。 我 们 采取 各 种 措施 检测 错误 ， 然 后 在 
错误 发 生 后 纠正 它们 。 


13.1 错误 处 理 的 理念 


并 发 Erlang 程 序 里 的 错误 处 理 建立 在 远程 检测 和 处 理 错误 的 概念 之 上 。 和 在 发 生 错 误 的 进程 
里 处 理 错 误 不 同 ， 我 们 选择 让 进程 朋 演 ， 然 后 在 其 他 进程 里 纠正 错误 。 

在 设计 容错 式 系统 时 就 假设 错误 会 发 生 ,， 进程 会 月 演 , 机 带 会 出 故障 。 我们 的 任务 是 在 错误 
发 生 后 检测 出 来 ,可 能 的 话 还 要 纠正 它们 。 同 时 要 避免 让 系统 的 用 户 注意 到 任何 的 故障 ， 或 者 在 
错误 修复 过 程 中 遭受 服务 中 朵 。 

因为 重点 在 补救 而 不 是 预防 上 , 所 以 系统 里 几乎 没有 防御 性 代码 , 只 有 在 错误 发 生 后 清理 系 
统 的 代码 。 这 就 章 味 着 我 们 将 把 注意 力 放 在 如 何 检 测 错 误 ， 如 何 识别 问题 来 源 ， 以 及 如 何 保 持 系 
统 处 于 稳定 状态 上 。 

检测 错误 和 找 出 故障 原因 内 建 于 Erlang 虚 拟 机 底层 的 功能 ， 也 是 Erlang 编 程 语 言 的 一 部 分 。 
标准 OTP 库 提供 了 构建 互相 监视 的 进程 组 和 在 检测 到 错误 时 采取 纠正 措施 的 功能 ，23.5 节 中 会 进 
行 相 关 介 绍 。 这 一 草 介 绍 的 是 语言 层面 的 错误 检测 和 恢复 。 

Erlang 关 于 构建 容错 式 软件 的 理念 可 以 总 结 成 两 个 容易 记忆 的 短 句 :“ 让 其 他 进程 
误 ” 和 “ 任 其 月 演 ”。 
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13.1.1 让 其 他 进程 修复 错误 


我 们 安排 一 些 进 程 来 互相 监控 各 目的 健康 状况 。 如 采 一 个 进程 挂 了 , 其 他 某 个 进程 就 会 注意 
到 并 采取 纠正 措施 。 

要 让 一 个 进程 监控 吃 一 个 ， 就 必须 在 它们 之 间 创 建 一 个 连接 (link ) 或 监视 (monitor )。 如 
条 钙 连 接 或 监视 的 进程 挂 了 ， 监 控 进 程 就 会 得 到 通知 。 

监控 进程 可 以 实现 路 机 带 的 透明 运作 , 因此 运行 在 菜 一 人 台 机 带 上 的 进程 可 以 监视 运行 在 不 同 
机 融 上 进程 的 行为 。 这 是 编写 容错 式 系 统 的 基础 。 不 能 在 一 全 机 天上 构建 容错 式 系统 ， 因 为 朋 泪 
的 可 能 是 整 台 机 带 ， 所 以 至 少 需要 两 台 机 带 。 一 人 台 机 带 负 责 计算 ， 其 他 的 机 带 负责 监控 它 ， 并 在 
第 一 侣 机 右 朋 沉 时 接管 计算 。 

这 可 以 作为 顺序 代码 错误 处 理 的 延 仲 。 昌 然 可 以 捕 提 顺序 代码 里 的 异 笛 并 答 试 纠正 错误 (这 
是 第 6 章 的 主题 )， 但 如 果 失 败 了 或 者 整 台 机 带 出 了 故障 ， 就 要 让 其 他 进程 来 修复 错误 。 






































13.1.2 ” 任 其 月 溃 


如 朱 你 来 目 C 这 样 的 语言 ， 这 上 听 起 来 会 非常 奇怪 。 在 C 里 ， 我 们 被 教导 要 编写 防御 性 代码 。 
程序 应 当 检 查 它们 的 参数 以 避免 朋 沉 。 在 C 里 这 人 么 做 很 有 和 必要: 编写 多 进程 代码 极其 困难 ， 而 绝 
大 多 数 应 用 程序 只 有 一 个 进程 ， 所 以 如 末 这 个 进程 让 整个 应 用 程序 月 尝 ， 计 烦 可 束 大 了 。 这 意味 
者 需要 大 量 的 错误 检查 代码 ,它们 会 和 非 错误 检查 代码 交织 在 一 起 。 

在 Erlang 里 ， 我 们 所 做 的 恰恰 相反 。 我 们 会 把 应 用 程序 构建 成 两 个 部 分 : 一 部 分 负责 解决 问 
名， 乃 一 部 分 负责 在 错误 发 生 时 纠正 它们 。 

负责 解决 问题 的 部 分 会 尽 可 能 地 少 用 防御 性 代码 , 并 假设 函数 的 所 有 参数 都 是 正确 的 , 程序 
也 会 正常 运行 。 

纠正 错误 的 部 分 往往 是 通用 的 ， 因 此 同一 段 错误 纠正 代码 可 以 用 在 许多 不 同 的 应 用 程序 里 。 
淮 个 例子 ,如果 数据 库 的 某 个 事务 出 了 错 ， 就 简单 地 中 止 该 事务 , 让 系统 把 数据 库 恢 复 到 出 错 之 
前 的 状态 。 如 果 操 作 系 统 里 的 菏 个 进程 朋 尝 了 ,就 让 操作 系统 关闭 所 有 打开 的 文件 或 僚 接 子 ， 然 
后 让 系统 恢复 到 某 个 稳定 状态 。 

这 么 做 让 任务 有 了 清楚 的 区 分 。 编写 解决 问题 的 代码 和 修复 错误 的 代码 , 但 两 者 不 会 交织 在 
一 起 。 代 码 的 体积 可 能 会 因此 显著 变 小 。 


13.1.3 为 何 要 月 演 


让 程序 在 出 错时 立即 崩溃 通常 是 一 个 很 好 的 主意 。 事 实 上 ， 它 有 不 少 优点 。 

DO 不 必 编写 防御 性 代码 来 防止 错误 ， 直 接 崩 溃 就 好 。 

D 不 必 思 考 应 对 措施 ， 而 是 选择 直接 骨 溃 ， 别 人 会 来 修复 这 个 错误 。 

D 不 会 使 错误 恶化 ， 因 为 无 需 在 知道 出 错 后 进行 额外 的 计算 。 

口 如 果 在 错误 发 生 后 第 一 时 间 举 旗 示 意 ， 就 能 得 到 非常 好 的 错误 诊断 。 在 错误 发 生 后 继续 
运行 经 常会 导致 更 多 错误 发 生 ， 让 调试 变 得 更 加 困难 。 
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口 编写 错误 恢复 代码 时 不 用 担心 朋 演 的 原因 ， 只 需要 把 注意 力 放 在 事后 清理 上 。 

口 它 和 价 化 了 系统 架构 ， 这 样 我 们 就 能 把 应 用 程序 和 错 误 恢复 当成 两 个 独立 的 问题 来 思考 ， 
而 不 是 一 个 交叉 的 问题 。 

相关 理念 已 经 介绍 得 差不多 了 ， 现 在 我 们 将 深入 其 中 的 细节 。 











找 其 他 人 来 修复 它 
让 别人 来 修复 某 个 错误 而 不 是 自己 动手 是 个 不 错 的 主意 ， 能 够 促进 专业 化 。 如 果 我 需要 
做 手术 ， 就 会 去 找 大 夫 ， 而 不 是 尝试 自己 操作 。 
如 果 我 的 汽车 出 了 点 小 问题 ， 车 上 的 控制 电脑 就 会 党 试 修复 它 。 如 果 修 复 失 败 、 问 题 变 
得 更 棘手 了 ， 就 必须 把 车 拉 到 修理 厂 ， 让 其 他 人 来 修理 它 。 
如 果 茶 个 Erlang 进 程 出 了 点 小 问题 ， 可 以 尝试 用 catch 或 try 语 多 来 修复 它 。 但 如 果 修 复 
失败 ， 就 应 该 直接 崩溃 ， 让 其 他 进程 来 修复 这 个 错误 。 


13.2 ”错误 处 理 的 术语 含 》 
在 这 一 节 里 ,你 将 学 到 进程 间 错 误 处 理 的 术语 含义 。 你 会 看 到 一 些 新 名 词 , 在 本 章 的 后 面 还 


会 再 次 遇 到 和 它们。 理解 错误 处 理 的 最 佳 方式 是 快速 浏览 这 些 名 词 的 定义 ， 然 后 跳 到 后 面 几 他， 通 
过 更 直观 的 方式 理解 相关 的 概念 。 如 果 有 需要 ， 可 以 随时 查阅 本 节 的 内 容 。 
@ 进程 
进程 有 两 种 : 普通 进程 和 系统 进程 。spawn 创 建 的 是 普通 进程 。 普 通 进程 可 以 通过 执行 内 
置 函 数 process flag(trap exit，true) 变 成 系统 进程 。 
@ 连接 
进程 可 以 互相 连接 。 如 采 A 和 B 两 个 进程 有 连接 ， 而 A 出 于 某 种 原因 终止 耻 ， 就 会 回 B 发 送 
一 个 错误 信号 ， 反 之 亦 然 。 
@ 连接 组 
进程 P 的 连接 组 是 指 与 P 相 连 的 一 组 进程 。 
@ 监视 
监视 和 连接 很 相似 ， 但 它 是 单 癌 的 。 如 果 A 监 视 B， 而 B 出 于 某 种 原因 终止 了 ， 就 会 回 A 发 
送 一 个 “大 机 ”消息 ， 但 反 过 来 就 不 行 了 。 
@ 消息 和 错误 信忠 
进程 协作 的 方式 是 交换 消息 或 错误 人 信号。 消息 是 通过 基本 了 男 数 send 发 送 的 ， 错 误 信 号 则 
是 进程 月 演 或 进程 终止 时 目 动 发 送 的 。 错 误 信 号 会 发 送 给 终止 进程 的 连接 组 。 
@ 错误 信号 的 接收 
当 系 统 进程 收 到 错误 信号 时 ， 该 信号 会 被 转换 成 { EXIT' ，Pid，Why} 形 式 的 消息 。Pid 
是 终止 进程 的 标识 ，Why 是 终止 原因 〈 有 时 候 被 称 为 退出 原因 )。 如 条 进程 是 无 错误 终止 ， 
Why 就 会 是 原子 normaL， 否 则 Why 会 是 错误 的 描述 。 
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普通 进程 收 到 错误 信号 时 ， 如 果 退 出 原因 不 是 normaL， 该 进程 就 会 终止 。 当 它 终止 时 ， 

同样 会 向 它 的 连接 组 广播 一 个 退出 信号。 

@ 显 式 错误 信号 
任何 执行 exit (Why ) 的 进程 都 会 终止 (如 有 宋代 码 不 是 在 catch 或 try 的 范围 内 执行 的 话 )， 
并 癌 它 的 连接 组 广播 一 个 市 有 原因 Why 的 退出 信号。 
进程 可 以 通过 执行 exit(Pid,，Why) 来 发 送 一 个 “虚假 ”的 错误 信号 。 在 这 种 情况 下 ，Pid 会 
收 到 一 个 带 有 原因 Why 的 退出 信和 号。 调用 exit/2 的 进程 则 不 会 终止 (这 是 有 意 如 此 的 ) 

@ | 
系统 进程 收 到 摧毁 信号 〈Kkill signal ) 时 会 终止 。 拱 毁 信 号 是 通过 调用 exit(Pid，KkitLL) 
生成 的 。 这 种 信号 会 绕 过 常规 的 错误 信号 处 理 机 制 , 不 会 被 转换 成 消息 。 摧毁 信号 只 应 该 
用 在 其 他 错误 处 理 机 制 无 法 终止 的 项 固 进程 上 。 

这 些 定义 可 能 看 上 去 很 复杂 , 但 通常 不 必 深 入 理解 这 些 机 制 的 工作 原理 也 能 编写 出 容错 式 代 

人 码 。 系 统 在 错误 处 理 方面 的 默认 行为 是 尝试 “做 正确 的 事 ”。 
后 面 几 区 将 用 一 系列 的 网 表 来 演示 错误 机 制 的 工作 方式 。 























13.3 创建 连接 
假设 有 一 组 互 不 相关 的 进程 ， 如 图 13-1a 所 示 。 虚 线 代 表 了 连接 。 





图 13-1 


为 了 创建 连接 , 我 们 会 调用 基本 隐 数 Link (Pid), 它 会 在 调用 进程 和 Pid 之 间 创 建 一 个 连接 。 
因此 ， 如 果 P1 调 用 Link(P3)，P1 和 P3 之 间 就 会 建立 连接 。 

P1 调 用 了 Link(P3) ，P3 又 调用 了 Link(P10) ， 以 此 类 推 ， 最 终 得 到 了 图 13-lb 所 展示 的 情形 。 
请 注意 ，P1 的 连接 组 只 有 一 个 元 素 (P3 )， 而 P3 的 连接 组 有 两 个 元 素 (Pl1 和 P10 )， 以 此 类 推 。 


13.4 同步 终止 的 进程 组 
通常 ， 你 希望 创建 能 够 同步 终止 的 进程 组 。 在 论证 系统 行为 的 时 候 , 这 是 一 个 非常 有 用 的 不 
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变法 则 。 当 多 个 进程 合作 解决 问题 而 某 处 出 现 问 题 时 , 有 时 候 我 们 能 进行 恢复 。 但 如 果 无 法 恢复 ， 
就 会 希望 之 前 所 做 的 一 切 事 情 都 停止 下 来 。 它 和 事务 (transaction ) 这 个 概念 很 像 : 进程 要 么 做 
它们 该 做 的 事 ， 要 么 全 部 被 杀 死 。 

假设 我 们 有 一 些 相互 连接 的 进程 而 其 中 的 某 个 进程 挂 了 ， 比 如 图 13-2a 中 的 P9。 网 a 展 示 了 P9 
终止 前 各 个 进程 是 如 何 连 接 的 ,图 b 展 示 了 P9 朋 沉 且 所 有 错误 信号 都 处 理 完成 后 还 镜 下 哪些 进程 。 














3 


当 P9 终 止 时 ， 错误 信号 被 发 送 给 进程 P4 和 P10。 因 为 P4 和 P10 不 是 系统 进程 ， 所 以 也 一 


起 终止 了 了 ， 随 后 ， 针 误 人 号 被 发 送 给 与 它们 相连 的 所 有 进程 。 最 后 ,错误 信号 扩散 到 了 所 有 相连 
的 进程 ， 整 个 互 连 进 程 组 都 终止 了 。 


如 果 P1、P3、P4、P9 或 P10 里 的 任意 进程 终止 ， 它 们 就 会 全 部 终止 。 
13.5 “设立 防火 墙 


有 时 候 我 们 不 和 希望 相连 的 进程 全 部 终止 ， 而 是 想 让 系统 里 的 错误 停止 扩散 。 图 13-3 对 此 进行 
了 演示 ， 里 面 所 有 的 相连 进程 那 会 终止 ,一 直到 P3 为 止 。 


ws 





图 13-2 
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要 实现 这 一 点 , P3 可 以 执行 process flag(trap exit, true) 并 转变 成 一 个 系统 进程 ( 意 
思 是 它 可 以 捕捉 退出 信号 )。 如 图 b 所 示 ， 它 用 双 圆 来 表示 。P9 骨 省 之 后 ， 错 误 的 扩散 会 在 P3 处 
停止 ， 因 此 P1 和 P3 不 会 终止 。 

P3 充 当 了 一 个 防火 墙 ， 阻 止 错 误 扩 散 到 系统 里 的 其 他 进程 中 。 








13.6 ”监视 
监视 与 连接 类 似 , 但 是 有 几 人 处 明显 的 区 别 。 
口 监视 是 单 问 的 。 如 果 A 监 视 B 而 B 挂 了 了， 就 会 回 A 发 送 一 个 退出 消息 , 反 过 来 则 不 会 如 此 ( 别 
饼 了 连接 是 双 同 的 ， 因 此 如 来 A 与 相连， 其 中 任何 一 个 进程 的 终止 部 会 叶 致 为 一 个 进程 
收 到 通知 )。 
口 如 东 被 监视 的 进程 挂 了 ， 就 会 问 监 视 进 程 发 送 一 个 “大 机 ”消息 ， 而 不 是 退出 信号 。 这 
就 意味 着 监视 进程 即使 不 是 系统 进程 也 能 够 处 理 错误 。 
当 你 想 要 不 对 称 的 错误 处 理 时 , 可 以 使 用 监视 ,对 称 的 错误 处 理 则 适合 使 用 连接 。 监 视 通 篆 
会 和 锌 服 务 俘 用 来 监视 客户 端的 行为 。 
下 一 市 将 对 操作 连接 和 监视 的 内 置 函 数 进行 介绍 。 


13.7 基本 错误 处 理 函 数 
下 列 基 本 函数 被 用 来 操作 连接 和 监视 ， 以 及 捕 提 和 发 送 退 出 信号 : 























@ -spec spawn link(Fun) -> Pid 
-Spec spawn link(Mod, Fnc, Args) -> Pid 
它们 的 行为 类 似 于 spawn (Fun) 和 spawn (Mod,Func,Args)， 同 时 还 会 在 父子 进程 之 间 创 
建 连接 。 


@ -shec Spawn Monitor(Fun) -> {Pid, Ref} 
-Spec spawn monitor(Mod, Func, Args) -> {Pid, Ref} 
它 与 spawn_link 相 似 , 但 创建 的 是 监视 而 非 连接 。Pid 是 新 创建 进程 的 进程 标识 人 符 ，Ref 
是 该 进程 的 引用 。 如 条 这 个 进程 因为 Why 的 原因 终止 了 ， 消 息 
{'DOWN' ,Ref,process,Pid,Why} 就 会 被 发 往 父 进程 。 


@ -spec process flag{trap exit, true) 


它 会 把 当前 进程 转变 成 系统 进程 。 系 统 进程 是 一 种 能 接收 和 处 理 错误 信号 的 进程 。 


@ -spec link(Pid) -> true 
它 会 创建 一 个 与 进程 Pid 的 连接 。 连 接 是 双 加 的。 如 果 进 程 A 执 行 了 Link(B) ， 就 会 与 B 相 
连 。 实 际 效果 就 和 B 执 行 Link(A) 一 样 。 
如 采 进 程 Pid 不 存在 ， 就 会 抛 出 一 个 noproc 退 出 异常 。 
如 采 执 行 Link(B) 时 A 已 经 连接 了 B (或 者 相反 )， 这 个 调用 就 会 被 忽略 。 
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@ -spec unlink(Pid) -> true 


它 会 移 除 当前 进程 和 进程 Pid 之 间 的 所 有 连接 。 


@ -spec erlang:monitor(process, ltem) -> Ref 
它 会 说 立 一 个 监视 。Item 可 以 是 进程 的 Pid， 也 可 以 是 它 的 注册 名 称 。 


@ -shec demonitor(Ref) -> true 


它 会 移 除 以 Ref 作 为 引用 的 监视 。 


@ -spec exit(Why) -> nonelj 
它 会 使 当前 进程 因为 Why 的 原因 终止 。 如 果 执 行 这 一 语句 的 子 句 不 在 catch 语 名 的 范围 内 ， 
此 进程 就 会 癌 当 前 连接 的 所 有 进程 广播 一 个 汕 有 参数 Why 的 退出 信号 。 它 还 会 回 所 有 监视 
它 的 进程 广播 一 个 DOWN 消 息 。 








@ -spec exit(Pid, Why) -> true 
它 会 同 进 程 Pid 发 送 一 个 市 有 原因 Why 的 退出 信号 。 执 行 这 个 内 置 函数 的 进程 本 映 不 会 终 
止 。 它 可 以 用 于 伪造 退出 信和 号。 
可 以 用 这 些 基 本 函数 来 设立 互相 监视 的 进程 网 络 ， 并 把 它 作 为 构建 容错 式 软件 的 起 点 。 
13.8 ”容错 式 编程 
在 这 一 市 里 , 你 将 学 到 一 些 编写 容错 式 代 码 的 简单 技巧 。 这 并 不 是 制作 容错 式 系统 的 完整 教 
程 ， 而 是 一 个 起 点 。 
13.8.1 在 进程 终止 时 执行 操作 


胃 数 on_exit(Pid，Fun) 会 监视 进程 Pid, 如 宋 它 因为 原因 Why 退出 了 , 如 会 执行 Fun (Why ) 。 





lib_misc.erl 


Line1 on _ exit(Pid, Fun) -> 


2 spawn(fun() -> 

3 Ref = monitor(process, Pid), 

4 receive 

5 {'DOWN', Ref, process, Pid, Why} -> 
6 Fun (Why) 

7 end 

8 end). 


monitor(process，Pid) (第 3 行 ) 对 Pid 创 建 了 一 个 监视 。 当 这 个 进程 终止 时 ， 监 视 进程 
就 会 接收 一 个 DOWN 消 县 (第 5 行 ) 并 调用 Fun (Why) (第 6 行 )。 3 
为 了 测试 它 ， 我 们 将 定义 一 个 F 困 数 ， 证 它 等 待 一 个 消息 X 然 后 计算 List to_atom(X) 。 
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1> F = fun() -> 
receive 
X -> list to atom(X) 
end 
end. 
#Fun<erl eval.20.69967518> 


为 什么 分 裂 和 连接 必须 是 原子 操作 
以 前 ，Erlang 有 两 个 基本 函数 : spawn 和 Link， 而 spawn Link(Mod，Func，Args) 的 定 
义 是 下 面 这 样 的 : 
spawn_ link(Mod, Func, Args) -> 
Pid = spawn (Mod, Fun, Args), 
Link(Pid) ， 
Pid. 
后 来 出 现 了 一 个 诡异 的 bug。 分 裂 出 的 进程 在 连接 语句 被 调用 前 就 挂 了 ， 因 此 进程 的 退出 
并 没有 生成 错误 信号 。 这 个 bug 花 了 好 长 时 间 才 找到 。 为 了 修复 这 个 问题 ， 我 们 添加 了 原子 操 
作 " 的 spawn Link。 只 要 涉及 并 发 ， 看 似 简 单 的 程序 也 可 能 会 变 得 很 坏 手 。 





我 们 将 分 裂 出 一 个 进程 : 
2> Pid = Spawn(F) ， 
<0 .61.0> 





然后 设立 一 个 on exit 处 理 进 程 来 监视 它 。 


3> lib misc:on exit(P1d, 
fun(Why) -> 
lio:format(" ~p died with:~p~n",[Pid, Why]) 
end). 
<0.63.0> 


如 果 癌 Pid 发 送 一 个 原子 ， 这 个 进程 就 会 挂 挥 ( 因为 它 试图 对 非 列表 类 型 执行 List to atom )， 
on _ exit 处理 进 程 则 会 得 到 通知 。 


4> Pid ! hello. 

hello 

5> 

=ERROR REPORT==== 14-May-2013::10:05:42 === 

Error In process <0.36.0> with exit value: 
{badarg, [{erlang,list to atom, [hello],[]}]} 








进程 挂 反 时 触发 的 函数 可 以 执行 任何 它 喜 欢 的 计算 : 它 可 以 忽略 错误 , 记录 错误 或 者 重 局 应 
用 程序 。 这 个 选择 完全 取决 于 程序 员 。 


J 原子 操作 ( atomic operation ) 是 指 把 一 个 或 多 个 步 又 捆绑 在 一 起 ， 成 为 不 可 分 割 的 单 次 操作 。 一 一 译 者 注 
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13.8.2 ”让 一 组 进程 共同 终止 


假设 要 创建 奉 干 工作 进程 来 解决 某 个 问题 ， 它 们 分 别 执 行 函 数 F1l1, F2...。 如 果 任 何 一 个 进 
程 挂 了 ,我们 希望 它们 能 全 体 终 止 。 可 以 调用 start([F1,F2，...]) 来 实现 这 一 点 。 


start(Fs) -> 
spawn (fun{() -> 
[spawn Link(F) || F <- Fs], 
receive 
after 
infinity -> true 
end 
end). 


start(Fs) 会 分 裂 出 一 个 进程 ， 后 者 随即 分 裂 并 连接 各 个 工作 进程 ， 然 后 无 限期 等 待 。 如 果 
任何 一 个 工作 进程 挂 了 ， 它 们 就 都 会 终止 。 

如 条 想 知 着 这 些 进 程 是 否 者 已 终止 ， 可 以 给 局 动 进 程 添加 一 个 on_exit 处 理 进 程 。 

Pid = start([F1, F2, ...]), 

on exit(Pid, fun(Why) -> 


"如果 任何 一 个 工作 进程 挂 了 ， 
就 运行 这 里 的 代码 








end ) 


13.8.3 生成 一 个 永 不 终止 的 进程 


在 这 一 和 草 的 最 后 , 我 们 将 生成 一 个 持久 运行 的 进程 。 具体 做 法 是 生成 一 个 始终 活动 的 注册 进 
程 ， 如 有 果 它 出 于 任何 原因 挂 了 ， 就 会 立即 重启 。 
可 以 用 on_exit 来 编写 它 。 











lib_misc.erl 
keep alive(Name, Fun) -> 
register (Name, Pid = spawn (Fun)), 
on exit(Pid, fun( Why) -> keep alive(Name, Fun) end). 
这 段 代码 生成 一 个 名 为 Name 的 注册 进程 ， 并 让 它 执行 spawn (Fun)。 如 有 果 这 个 进程 出 于 任何 
原因 挂 了 ， 就 会 被 重 局 。 
on exit 和 keep alive 里 有 一 个 相当 微妙 的 错误 。 如 果 仔 细 查 看 下 面 这 两 行 代码 : 
Pid = register(...), 
on exit(Pid, fun(X) -> .,.), 
我 们 就 能 看 到 进程 有 可 能 会 在 这 两 个 语句 之 间 挂 掉 。 如 果 进 程 在 on_exit 被 执行 之 前 终止， 
就 不 会 创建 连接 ，on_exit 进 程 的 行为 就 会 和 预计 的 不 同 。 如 果 有 两 个 程序 同时 尝试 用 相同 的 
Name 值 执行 keep_alive, 这 个 错误 就 会 发 生 。 这 被 称 为 竞争 状况 (race condition ): 两 段 代 码 (都 
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是 这 段 ) 和 on_exit 里 执行 连接 操作 的 代码 片段 正在 互相 竞争 。 如 果 这 里 出 了 错 ， 程 序 就 可 能 会 
表现 出 你 预料 之 外 的 行为 。 

我 不 会 在 此 处 解决 这 个 问题 ， 而 是 让 你 目 己 思考 该 怎么 做 。 组 合 使 用 spawn 、 
spawn_monitor 和 register 等 Erlang 基 本 函数 时 ， 必 须 仔 细 考 虑 潜在 的 竞争 状况 ， 确 保 代 码 不 
会 让 这 些 状况 发 生 。 

现在 你 已 经 了 解 了 所 有 错误 处 理 的 知识 ,顺序 代码 无 法 捕捉 的 错误 会 从 发 生 错 误 的 进程 中 流 
出 , 沿 看 连接 到 达 其 他 进程 ， 而 后 者 可 以 根据 设 定 来 处 理 这 些 错 误 。 我们 描述 过 的 所 有 机 制 ( 连 
接 过 程 等 ) 都 可 以 实现 跨 机 器 的 透明 运作 。 

路 机 需 运 作 市 领 我 们 进入 了 分 布 式 编程 的 领域 。Erlang 进 程 可 以 在 网 络 上 的 其 他 物理 机 器 中 
分 裂 出 新 的 进程 ， 这 让 编写 分 布 式 程序 变 得 简单 了 。 而 这 正 是 下 一 章 的 主题 。 














13.9 练习 


(1) 编写 一 个 my spawn(Mod，Func，Args) 国 数 。 它 的 行为 类 似 spawn(Mod，Func，Args ) ， 
但 有 一 点 区 别 。 如 果 分 裂 出 的 进程 挂 了 ,就 应 打印 一 个 消 奶 ,说 明 进 程 挂 挥 的 原因 以 及 在 此 之 前 
存活 了 多 长 时 间 。 

(2) 用 本 章 前 面 展 示 的 on exit 困 数 来 完成 上 一 个 练习 。 

(3) 编写 一 个 my_spawn (Mod,，, Func, Args，, Time) 上 吨 数 。 它 的 行为 类 似 spawn(Mod，Func ， 
Args) ， 但 有 一 点 区 别 。 如 有 果 分 裂 出 的 进程 存活 超过 了 Time 秒 ， 就 应 当 被 摊 毁 。 

(4) 编写 一 个 函数 ， 让 它 创 建 一 个 每 隔 5 秒 就 打印 一 次 “我 还 在 运行 ”的 注册 进程 。 编 写 一 个 
国 数 来 监视 这 个 进程 ， 如 采 进 程 挂 了 就 重 局 它 。 局 动 公 共 进 程 和 监视 进程 ， 然 后 拱 毁 公共 进程 ， 
检查 它 是 否 会 被 监视 进程 重 局 。 

(5) 编写 一 个 函数 来 启动 和 监视 多 个 工作 进程 。 如 果 任 何 一 个 工作 进程 韭 正 党 终止， 就 重 
局 它 。 

(6) 编写 一 个 函数 来 启动 和 监视 多 个 工作 进程 。 如 果 任 何 一 个 工作 进程 韭 正常 终 止 ， 就 挫 虹 
所 有 工作 进程 ， 然 后 重启 它们 。 
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用 Erlang 编 写 分 布 式 程序 和 编写 并 发 程序 只 有 一 步 之 带 。 在 分 布 式 Erlang 里 ， 可 以 在 远程 市 
点 和 机 送 上 分 裂 进程 。 分 裂 出 远程 进程 之 后 ,我们 会 看 到 其 他 所 有 的 基本 因数 (send、receive 
和 Link 等 ) 都 能 透明 运作 在 网 络 中 ， 就 像 在 单个 太 点 上 一 样 。 
在 本 曹 ， 我 们 将 介绍 用 于 编写 分 布 式 Erlang 程 序 的 库 与 Erlang 基 本 颗 数 。 分 布 式 程序 是 那些 
被 设计 运行 在 计算 机 网 络 上 的 程序 ， 并 且 可 以 仅 靠 传递 消息 来 协调 彼此 的 活动 。 
下 面 是 一 些 想 要 编写 分 布 式 应 用 程序 的 原因 。 
@ ' 性 能 
可 以 通过 安排 程序 的 不 同 部 分 在 不 同 的 机 右上 并 行 运 行 来 让 程序 跑 得 更 快 。 

@ 可 靠 性 
可 以 通过 让 系统 运行 在 数 台 机 融 上 来 实现 容错 式 系统 。 如 采 一 人 台 机 器 出 了 故障 , 可 以 在 另 
一 台 机 需 上 继续 。 

@ 可 扩展 性 
随 着 我 们 把 应 用 程序 越 做 越 大 ， 即 使 机 各 的 处 理 能 力 再 强大 也 迟早 会 耗 尽 。 到 那 时 ， 就 必 
须 添 加 更 多 的 机 融 来 提升 处 理 能 力 。 添 加 一 台新 机 带 应 当 是 一 次 简单 的 操作 , 不 需要 对 应 
用 程序 的 架构 做 出 大 的 修改 。 

@ 天 生 分 布 式 的 程序 
许多 应 用 程序 天 生 就 是 分 布 式 的 。 如 果 编 写 一 个 多 用 户 游 戏 或 聊天 系统 , 就 会 有 来 目 世 界 
各 地 的 分 散 用 户 。 如 果 我 们 在 某 个 地 理 位 置 上 拥有 大 量 的 用 户 , 就 会 希望 把 计算 资源 放置 
在 接近 这 些 用 户 的 地 方 。 

@ fun 


我 想 要 编写 的 fan 程序 大 部 分 痢 是 分 布 式 的。 其 中 许多 涉及 与 全 世界 各 地 的 人 与 机 侣 进行 交互 。 


14.1 两 种 分 布 式 模型 


我 们 在 本 书 里 将 讨论 两 种 主要 的 分 布 式 模型 。 
@ 分 布 式 Erlang 
在 分 布 式 Erlang 里 ， 我 们 编写 的 程序 会 在 Erlang 的 节点 ( node ) 上 运行 。 节 点 是 一 个 独立 
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的 Erlang 系 统 ， 包 含 一 个 目 市 地 址 空间 和 进程 组 的 完整 虚拟 机 。 
可 以 在 任何 证 点 上 分 裂 进 程 ,前 几 章 讨论 的 所 有 消 奶 传递 和 错误 处 理 基本 孔 数 也 都 能 像 在 
单方 点 上 那样 工作 。 
分 布 式 Erlang 应 用 程序 运行 在 一 个 可 信 环 境 中 。 因 为 任何 节点 都 可 以 在 其 他 Erlang 闻 点 上 
执行 任意 操作 ， 所 以 这 涉及 高 度 的 信任 。 虽 然 分 布 式 Erlang 应 用 程序 可 以 运行 在 开放 式 网 
络 上 ， 但 它们 通常 是 运行 在 属于 同一 个 局 域 网 的 集群 上 ， 并 受 防火 增 保 护 。 

@ 基于 套 接 字 的 分 布 式 模型 
可 以 用 TCP/P 奉 接 字 来 编写 运行 在 不 可 信 环 境 中 的 分 布 式 应 用 程序 。 这 个 编程 模型 不 如 分 
布 式 Erlang 那 样 强 大 ， 但 是 更 安全 。 在 14.6 节 里 ， 我 们 会 来 看 看 如 何 用 基于 套 接 字 的 简单 
分 布 式 机 制 来 构建 应 用 程序 。 

如 果 你 回想 一 下 前 儿童 的 内 容 , 就 一 定 还 记得 我 们 构建 程序 的 基本 单位 是 进程 。 编 写 分 布 式 
Erlang 程 序 古 很 容易 的 ， 要 做 的 就 是 在 正确 的 机 各 上 分 裂 出 进程 ， 然 后 一 切 就 能 像 之 前 那样 运 
作 了 。 

我 们 都 习惯 了 编写 顺序 程序 ,而 编写 分 布 式 程 序 通 常会 困难 得 多 。 在 这 一 章 里 , 我 们 将 介绍 
编写 简单 分 布 式 程序 的 各 和 干 技巧 。 这 些 程序 很 简单 ， 但 是 非常 有 用 。 

我 们 将 从 一 些小 范例 起 步 。 只 需 先 学 习 两 件 事 ,就 可 以 开始 创建 我 们 的 第 一 个 分 布 式 程序 了 。 
我 们 将 学 习 如 何 局 动 一 个 Erlang 季 点， 以 及 如 何在 远程 Erlang 和 点 上 执行 远程 过 程 调用 。 


14.2 ”编写 一 个 分 布 式 程 序 


当 我 开发 一 个 分 布 式 应 用 程序 时 ， 总 是 会 按照 特定 的 顺序 来 编写 它 。 

(1) 在 一 个 帝 规 的 非 分 布 式 会 话 里 编写 和 测试 我 的 程序 。 这 是 我 们 到 目前 为 止 一 直 在 做 的 ， 
所 以 不 会 有 什么 新 间 题 。 

(2) 在 运行 于 同一 台 计 算 机 上 的 两 个 不 同 的 ErlangT 点 里 测试 程序 。 

(3) 在 运行 于 两 台 物 理 隔 离 计 算 机 上 的 两 个 不 同 的 Erlang 节 点 里 测试 程序 ， 这 两 台 计 算 机 或 
者 属于 同一 个 局 域 网 ， 或 者 来 日 互联 网 的 任何 地 方 。 

最 后 一 步 可 能 会 市 来 问题 。 如 果 所 运行 的 机 器 属于 相同 的 管理 域 , 就 很 少 会 出 问题 。 但 当 相 
关节 点 属于 不 同 域 上 的 机 融 时 , 我 们 就 可 能 会 遇 到 连接 性 问题 , 而 且 必 须 确保 系统 防火 墙 和 安全 
设置 都 已 得 到 正确 配置 。 

为 了 演示 这 些 步 又 ， 我 们 将 制作 一 个 简单 的 名 称 服务 顺 ( name server )。 具 体 而 言 ， 将 执行 
下 列 步 又 。 

口 第 1 阶段 : 在 一 个 篆 规 的 非 分 布 式 Erlang 系 统 上 编写 和 测试 名 称 服务 硕 。 

口 第 2 阶段 : 在 同一 人 台 机 需 的 两 个 节点 上 测试 名 称 服 务 融 。 

口 第 3 阶段 : 在 同一 局 域 网 内 分 属 两 台 不 同 机 需 的 节点 上 测试 名 称 服务 硕 。 

口 第 4 阶段 : 在 分 属 两 个 不 同 国家 和 域 的 两 台 机 磊 上 测试 名 称 服务 磊 。 
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引 


14.3 ”创建 名 称 服务 


名 称 服务 器 这 种 程序 会 返回 一 个 给 定名 称 的 天 联 值 。 我 们 也 可 以 修改 某 个 名 称 所 关联 的 值 。 
我 们 的 第 一 个 名 称 服务 全 极其 简单 。 它 不 是 容错 式 的 ， 所 以 如 果 它 朋 演 了 ,保存 的 数据 就 会 
全 部 丢失。 这 个 练习 的 目的 不 是 创建 一 个 容错 式 名 称 服务 融 ， 而 是 开始 运用 分 布 式 编程 的 技巧 。 


14.3.1 第 1 阶段 : 一 个 简单 的 名 称 服务 器 
我 们 的 名 称 服 务 器 kvs 是 一 个 简单 的 Key 一 Value 服 务 器 ， 它 的 接口 如 下 。 








@ -spec kvs:startl) -> true 


司 动 服务 天 。 它 将 创建 一 个 注册 和 名 为 kvs 的 服务 做 。 


@ -spec kvs:store(Key, Value) -> true 
关联 Key 和 Value。 


@ -spec kvs:lookup(Key) -> {ok, Value} | undefined 
查询 Key 的 伸 。 如 果 Key 帘 有 关联 值 就 返回 {ok，Vatlue}， 否 则 返回 undefined。 
这 个 键 -信服 务 天 是 用 进程 字典 里 的 基本 函数 get 和 put 实 现 的 ， 它 的 代码 如 下 : 


socket dist/kvs.erl 


Line1 -module(kvs). 
- -export([start/0, store/2, lookup/1]). 


start() -> register(kvs, spawn(fun() -> loop() end)). 
- Store(Key, Value) -> rpc({store, Key, Value}). 


- lookup(Key) -> rpc({lookup, Key}). 


10 rpc(Q) -> 
- kvs ! {self(), Q}, 
receive 
{kvs, Reply} -> 
Reply 
15 end. 
- loop() -> 
receive 
{From, {store, Key, Value}} -> 
20 put (Key, {ok, Value}), 


From ! {kvs, true}, 
Loop(); 
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{From, {lookup, Key}} -> 
_ From ! {kvs, get(Key)}, 
25 Loop() 
end. 


保存 ( store ) 消息 在 第 6 行 发 送 并 在 第 19 行 接收 。 主 服务 带 在 第 17 行 的 Loop 冰 数 中 局 动 。 它 
调用 了 receive 并 等 符 一 个 保存 或 查询 消息 ， 然 后 保存 数据 或 从 本 地 进程 字典 里 取出 被 请 求 的 数 
据 ， 并 回 客 户 庙 发 送 回复 。 首 先 将 在 本 地 测试 这 个 服务 六， 看 看 它 是 否 能 正常 工作 。 


1> kvs:'start(). 




















true 

2> kvs:store({location, joe}, "Stockholm"). 
true 

3> kvs:store(weather, raining). 

true 


4> kvs':lookup (weather)}). 

{ok, raining} 

5> kvs:lookup({location, joe}). 
{ok,"Stockholm"} 

6> kvs:lookup({LlLocation, jane}). 
undefined 


到 目前 为 止 , 没有 什么 意料 之 外 的 事情 发 生 。 下面 进入 第 2 个 步 又 ,把 这 个 应 用 程序 分 布 化 。 
14.3.2 第 2 阶段: 客 尸 端 在 一 个 节点 ， 服 务 器 在 相同 主机 的 另 一 个 证 点 


现在 在 同一 台 计 算 机 上 局 动 两 个 Erlang 放 点。 为 此 ， 需 要 打开 两 个 终端 窗口 ， 然 后 局 动 两 套 
Erlang 系 统 。 

首先 ， 将 开启 一 个 终端 shell， 并 在 这 个 shell 里 启动 一 个 名 为 gandalf 的 分 布 式 Erlang 节 点 。 
然后 启动 服务 右 : 


$ erl -sname gandalf 
(gandalf@localhost) 1> kvs:start!(). 
true 


参数 -sname gandalf 的 意思 是 “在 本 地 主机 上 启动 一 个 名 为 gandalf 的 Erlang 方 点 ”。 注 意 
一 下 Erlang shell 是 如 何 把 Erlang 节 点 名 打印 在 命令 提示 符 前 面 的 。 节 点 名 的 形式 是 NameGQHost。 
Name 和 Host 都 是 原子 ， 所 以 如 果 它 们 包含 任何 非 原子 的 字符 ， 就 必须 加 上 引号 。 

















重要 提示 “如果 你 在 自己 的 系统 上 运行 上 面 的 命令 ， 节 点 名 可 能 就 不 是 gandoLfQLocaLhost， 
而 是 gandolf@H ( 如果 H 是 你 的 本 地 主机 名 的 话 )。 它 会 根据 你 的 系统 配置 而 定 。 如 
果 情 况 确实 如 此 ， 就 必须 在 接 下 来 所 有 的 范例 里 用 名 称 H 代 替 LocaLhost。 


接 下 来 将 开局 第 二 个 终端 会 话 ， 然 后 司 动 一 个 名 为 biLtbo 的 Erlang 节 点。 这 样 焉 可 以 用 库 模 
块 rpc 来 调用 kvs 里 的 函数 了 。( 请 注意 ，rpc 是 一 个 标准 的 Erlang 库 模块 ， 和 之 前 编写 的 rpc 郴 数 
不 是 - 回 事 。) 
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$ erL -sname bilbo 

(bitlbo@localhost) 1> rpc:call(gandalf@localhost, 
kvs,store, [weather, finel]). 

true 

(bilbo@localhost) 2> rpc:call(gandalf@localhost, 
kvs, Lookup, [weather] ) . 











{ok, fine} 
虽然 看 起 来 不 太 起 眼 , 但 实际 上 已 经 执行 了 我 们 的 第 一 次 分 布 式 计算 ! 服务 硕 运 行 在 我 们 局 
动 的 第 一 个 节点 上 上， 客户 并 则 运行 在 第 二 个 节点 上 。 


设置 weather 值 的 调用 是 由 bilbo 市 点 发 出 的 ， 可 以 切换 回 gandalf 来 检查 一 下 天 气 
( weather ) 的 值 。 

(gandalf@localhost) 2> kvs:lookup(weather). 

{ok, fine} 

rpc:call (Node，Mod，Func，[Argl1，Arg2，...，ArgN]) 会 在 Node 上 执行 一 次 远程 过 
程 调 用 。 后 Arg2，..,，ArgN)。 

如 你 所 见 ， 这 个 程序 的 工作 方式 和 非 分 布 式 Erlang 一 致 。 唯 一 的 区 别 在 于 客户 端 运行 在 一 个 
广 尽 上， 而 服务 右 运 行 在 为 一 个 不 同 的 广 点 上 。 

下 一 步 是 在 不 同 的 机 融 上 运行 客户 端 和 服务 需 

















14.3.3 第 3 阶段 : 同一 局 域 网 内 不 同 机 器 上 的 客 尸 端 和 服务 器 


我 们 将 使 用 两 个 节点 。 第 一 个 名 为 gandalf 的 节点 在 doris .myerl.example.com 上 ， 第 二 
个 名 为 biLbo 的 节点 el myerl.example.com 上 。 开 始 工 作 之 前 ， ri 
有 具 在 两 台 不 同 的 机 融 上 各 局 动 一 个 终端 。 我 们 把 这 两 个 窗口 称 为 doris 和 george。 做 完 这 些 之 后 ， 
我 们 就 可 以 在 两 台 机 器 上 轻松 输入 命令 了 。 
第 1] 步 是 在 doris 上 启动 一 个 Erlang 广 点 。 


doris $ erl -name gandalf -setcookie abc 
{gandatlf@doris.myerl.example.com) 1> kvs:start!(). 
true 


第 2 步 是 在 george 上 启动 一 个 Erlang 节 点 并 向 gandalf 发 送 一 些 命 


george $ erl -name bilbo -setcookie abc 


(bitlbo@george.myerl.example.com) 1> rpc:call(gandalf@doris .myerl .example.com, 
kvs ,store, [weather ,cold] ) . 
true 


(bilbo@george.myerl.example,.com) 2> rpc:call(gandalf@doris.myer\l .example.com, 
kvs ,Lookup, [weather] ) . 
{ok,cold} 


它们 的 行为 和 同一 机 各 上 两 个 不 同市 点 的 情况 完全 一 致 。 
要 实现 这 一 切 , 我 们 的 操作 会 比 在 同一 台 机 各 上 运行 两 个 市 点 时 略微 复杂 一 些 。 我 们 必须 分 
4 步 走 。 





A 
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(1) 用 -name 人 参数 启动 Erlang。 我 们 在 同一 台 机 需 上 运行 两 个 节点 时 使 用 了 “ 短 ”( short ) 名 
称 (通过 -sname 标 识 体 现 )。 但 如 果 它 们 属于 不 同 的 网 络 ， 我 们 就 要 使 用 -name。 

当 两 台 机 器 位 于 同一 个 子 网 时 我 们 也 可 以 使 用 -sname。 而 且 如 果 没 有 DNS 服务 ，- sname 就 
是 唯一 可 行 的 方式 。 

(2) 确保 两 个 方 点 拥有 相同 的 cookie。 这 正 是 启动 两 个 节点 时 都 使 用 命令 行 参数 -setcookie 
abc 的 原因 。 我 们 会 在 14.5 节 对 它 做 更 详细 的 介绍 。 











注意 当 我 们 在 同一 台 机 器 上 运行 两 个 节点 时 ， 因 为 它们 都 能 访问 同一 个 cookie 文 件 
$HOME/ .erLang. cookie， 所 以 我 们 不 需要 在 Erlang 命 令 行 里 添加 cookie。 





(3) 确保 相关 节点 的 完全 限定 主机 名 (fally qualified hostname ) 可 以 被 DNS 解析 。 对 于 我 来 
说 ， 域 名 myerL.examptLe.com 完 全 属于 我 的 家 庭 网 络 ， 通 过 在 /etc/hosts 里 添加 一 个 条 目 来 实 
现 本 地 解析 。 

(4) 确保 两 个 系统 拥有 相同 版 本 的 代码 和 相同 版 本 的 Erlang。 如 果 不 这 么 做 ， 就 可 能 会 得 到 
严重 而 离奇 的 错误 。 避 人 免 问 题 的 最 简单 的 方法 是 在 所 有 地 方 都 运行 相同 版 本 的 Erlang。 不 同 版 本 
的 Erlang 可 以 一 起 运行 , 但 是 无 法 保证 能 正常 工作 , 所 以 最 好 事先 检查 一 下 。 在 我 们 这 个 有 宁 例 里 ， 
相同 版 本 的 kvs 代 人 码 必 须 存 在 于 两 个 系统 中 。 通 过 下 列 方法 可 以 做 到 这 一 点 。 

口 我 家 里 有 两 台 物 理 隔 离 的 计算 机 , 它们 没有 共 至 的 文件 系统 。 在 那里 我 先 手 工 把 kvs .erl 

复制 到 这 两 台 计 算 机 上 ， 编译 它们 之 后 再 启动 程序 。 

口 我 的 工作 计算 机 是 市 有 一 个 共享 NFS 和 磁盘 的 工作 站 。 在 那里 我 只 需要 让 两 人 台 工 作 站 从 共 语 

目录 里 启动 Erlang 就 行 了 了。 

口 配置 代码 服务 器 来 实现 这 一 点 。 我 不 会 在 这 里 介绍 具体 做 法 ， 你 可 以 去 看 看 

erl prim Loader 模 块 的 手册 页 。 

口 使 用 shell 命 令 command nL(Mod) 。 它 会 在 所 有 的 相连 节点 上 载 人 人 Mod 模块 。 
































注意 要 使 用 这 个 命令 ， 必 须 确保 所 有 节点 都 已 连接 。 节 点 会 在 它们 第 一 次 尝试 互相 访 
问 时 建立 连接 。 当 首次 执行 与 菜 个 远程 节点 相关 的 任意 表达 式 时 ， 它 就 会 发 生 。 
最 简单 的 做 法 是 执行 net adm:ping(Node) (详情 请 参见 net adm 的 手册 页 )。 














成 功 了 ! 我 们 正在 同一 局 域 网 的 两 台 服务 器 上 运行 。 下 一 步 是 把 它们 移 到 两 台 通 过 互联 网 相 
连 的 计算 机 上 。 
14.3.4 ”第 4 阶段 ， 跨 互联 网 不 同 主机 上 的 客户 端 和 服务 器 


原则 上 ， 这 和 第 3 阶段 是 一 样 的 ， 但 现在 我 们 必须 更 加 关注 安全 性 。 运 行 同 一 局 域 网 内 的 两 
个 市 点 时 , 多 半 不 会 过 于 担心 安全 性 。 在 大 多 数 机 构 里 , 局 域 网 午 是 通过 防火 墙 与 互联 网 隔离 的 。 
可 以 在 防火 墙 后 面 自由 分 配 临 时 IP 地 址 ， 对 机 器 的 设置 也 很 随意 。 
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当 我 们 跨 互 联网 连接 Erlang 集 群 里 的 几 台 机 和 大 时 ， 可 以 预料 到 会 出 现 防 火 墙 不 允许 传人 连接 
的 问题 。 必 须 正确 配置 防火 墙 , 让 它 接受 传人 连接 。 这 一 点 没有 通用 的 做 法 ， 因 为 每 一 种 防火 载 
都 是 不 同 的 。 

要 让 系统 准备 好 运行 分 布 式 Erlang， 需 执行 以 下 步骤 。 

(1) 确保 4369 端 口 对 TCP 和 UDP 流量 都 开放 。 这 个 端口 会 被 一 个 名 为 epmd 的 程序 使 用 〈 它 是 
Erlang Port Mapper Daemon 的 缩写 ， 即 Erlang 冰 口 映射 守护 进程 )。 

(2) 选择 一 个 或 一 段 连 续 端 口 给 分 布 式 Erlang 使 用 ， 并 确保 这 些 端 口 是 开 放 的 。 如 有 果 这 些 端 
口 位 于 Min 和 Max 之 间 ( 只 想 用 一 个 端口 就 让 Min=Max )， 就 用 以 下 命令 启动 Erlang: 


$ erL -name ... -Setcookle ... -kernel inet dist listen min Min \ 
inet dist listen max Max 


现在 ,我 们 已 经 了 解 了 如 何在 一 组 Erlang 有 点 上 运行 程序 ， 以 及 如 何 通过 局 域 网 和 互联 网 运 
行 它们 。 下 面 来 看 看 操作 刷 点 的 基本 函数 。 
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我 们 在 编写 分 布 式 程序 时 很 少 从 头 开 始 。 标准 库 里 有 许多 模块 可 以 用 于 编写 分 布 式 程序 。 虽 
然 这 些 模 块 是 用 内 置 分 布 式 函数 编 与 的 ， 但 是 它们 能 对 程序 员 陆 藏 大 量 楷 琐 的 细 记 。 

标准 分 发 套 半 里 的 两 个 模块 能 够 满足 大 多 数 需 求 。 

口 rpc 提 供 了 许多 远程 过 程 调用 服务 。 

口 g9Lobal 里 的 函数 可 以 用 来 在 分 布 式 系统 里 注册 名 称 和 加 锁 ， 以 及 维护 一 个 全 连接 网 络 。 


























rpc 模 块 里 最 重要 的 函数 就 是 下 面 这 个 。 


call(Node, Mod, Function, Args) -> Result | {badrpc, Reason} 





它 会 在 Node 上 执行 apply (Mod，Function，Args)， 然后 返回 结果 Result， 如 有 果 调 用 失败 
则 返回 {badrpc，Reason}。 

以 下 是 编写 分 布 式 程序 的 基本 函数 (关于 这 些 内 上 置 函 数 的 更 完整 的 介绍 请 参见 erlang 模 块 
的 手册 页 ?)。 





@ -shec spawn(Node, Fun) -> Pid 
它 的 工作 方式 和 spawn(Fun) 完 全 一 致 ， 只 是 新 进程 是 在 Node 上 分 裂 的 。 


@ -spec spawn(Node, Mod, Func, ArgList) -> Pid 
它 的 工作 方式 和 spawn (Mod，, Func, ArgList) 完 全 一 致 ， 只 是 新 进程 是 在 Node 上 分 裂 的 。 
spawn(Mod，Func，Args) 会 创建 一 个 执行 appLy(Mod，Func，Args) 的 新 进程 。 它 会 返 
回 这 个 新 进程 的 PID。 


GD http://www.erlang.org/doc/man/erlang.html 
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注意 ”这 种 形式 的 spawn 比 spawn (Node，Fun) 更 加 健壮 。 如 果 运 行 在 多 个 分 布 式 节点 上 
的 特定 模块 不 是 完全 相同 的 版 本 ，spawn (Node，Fun) 就 可 能 会 出 错 。 


@ -shec spawn link(Node, Fun) -> Pid 
它 的 工作 方式 和 spawn_Link(Fun) 完 全 一 致 ， 只 是 新 进程 是 在 Node 上 分 裂 的 。 





@ -spec spawn link(Node, Mod, Func, ArgList) -> Pid 
它 的 工作 方式 类 似 spawn (Node, Mod，, Func, ArgList), 但 是 新 进程 会 与 当前 进程 相连 。 





@ -spec disconnect node(Node) -> bool{() | ignored 


它 会 强制 断 开 与 某 个 节操 的 连接 。 





@ -spec monitor node(Node, Flag) -> true 
如 采 FLag 是 true 就 会 开局 监视 ， Flag 二 false 就 会 关闭 监 袖 。 如 果 开 启 了 监视 ,那么 当 
Node 加 入 或 离开 Erlang 互 连 节 点 组 时 ， 执 行 这 个 内 置 郴 数 的 进程 就 会 收 到 {nodeup，Nodel} 
或 {nodedown，Node} 的 消息 。 








@ -spec node(l) -> Node 


它 会 返回 本 地 节点 的 名 称 。 如 果 节 点 不 是 分 布 式 的 则 会 返回 nonodeGnohost。 








@ -shec nodetArgj -> Node 
它 会 返回 Arg 所 在 的 节点 。Arg 可 以 是 PID 、 引 用 或 者 端口 。 如 果 本 地 节点 不 是 分 布 式 的 ， 
则 会 返回 nonodeGnohost 。 








@ -5Spec nodes() -> [Nodel 


它 会 返回 一 个 列表 ， 内 含 网 络 里 其 他 所 有 与 我 们 相连 的 节点 


-spec Is alive{) -> bool() 


如 末 本 地 节点 是 活动 的 , 并 且 可 以 成 为 分 布 式 系 统 的 一 部 分 , 就 返回 true, 否则 返回 false。 
另外 , send 可 以 用 来 向 一 组 分 布 式 Erlang 广 点 里 的 某 个 本 地 注册 进程 发 送 消 息 。 下 面 的 语法 : 





{RegName, Node} ! Msg 
可 以 把 消息 Msg 发 送 给 节点 Node 上 的 注册 进程 RegName。 


14.4.1 远程 分 多 示 例 


作为 一 个 简单 的 示例 ， 我 们 将 展示 如 何在 某 个 远程 节点 上 分 裂 进 程 。 先 从 下 面 这 个 程序 


开始 。 
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dist demo.erl 
-module(dist demo). 
-export([rpc/4, start/y1]). 


start(Node) -> 
spawn (Node, fun() -> Loop() end). 


rpcec(Pid, M, F, A) -> 
Pid ! {rpc, self(), M, F, A}, 


receive 
{Pid, Response} -> 
Response 
end ， 
loop() -> 
receive 


{rpc, Pid, M, F, A} -> 
Pid ! {self(), (catch apply(M, F, A))}, 
Loop() 
end. 


然后 局 动 两 个 节点 ,它们 都 必须 能 够 载 和 这 段 代 码 。 如 条 这 两 个 布点 在 同一 全 主机 上 , 这 就 
不 成 问题 。 只 需 从 同一 个 目录 里 启动 两 个 Erlang 闻 点 就 可 以 了 。 

如 果 市 点 分 别 属于 两 台 物 理 隔离 旦 文件 系统 不 同 的 主机 ,这 个 程序 就 必须 被 复制 到 所 有 市 点 
上 ， 编 译 之 后 才能 启动 节点 (或 者 也 可 以 把 ,beam 文件 复制 到 所 有 节点 上 )。 在 这 个 例子 里 ,我 
假定 这 一 切 都 已 完成 。 

在 主机 doris 上 上 ， 局 动 一 个 名 为 gandalf 的 市 点 。 


doris $ erl -name gandalf -setcookie abc 
(gandalf@doris.myerl,.example,com) 1> 


在 主机 george 上 ， 启 动 一 个 名 为 bitlbo 的 节点 ， 要 记得 使 用 同一 个 cookie。 


george $ erl -name bilbo -setcookie abc 
(bilbo@george.myerl.example.com) 了 > 


现在 (在 biLtbo 上 )， 让 远程 方 点 (gandalf ) 分 裂 一 个 进程 。 


(bitlbo@george.myerl.example.com) 1> Pid = 
dist demo:start('gandalf@doris.myerl .example.com' ). 
<5094.40.0> 


现在 ，Pid 是 这 个 远程 节点 进程 的 标识 符 ， 调 用 dist demo: rpc/4， 在 远程 节点 上 执行 一 次 
远程 过 程 调用 。 


(bilbo@george.myerl.example.com) 2> dist demo:rpc(Pid, erlang, node, []). 
‘gandalf@doris.myerl .example,.com’ 


它 在 远程 节点 上 执行 erLang:node() 并 返回 一 个 值 。 
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14.4.2 ”文件 服务 器 再 探 


我 们 在 2.3.1 节 创建 了 一 个 文件 服务 器 ,并 且 承 诺 稍 后 会 再 次 讨论 它 , 也 就 是 指 现在 了 。 本章 
前 面部 分 展示 了 如 何 设立 一 个 简单 的 远程 过 程 调用 服务 硕 ， 它 可 用 来 在 两 个 ErlangT 点 之 间 传 输 
Xs 

下 面 这 些 操作 是 上 一 个 示例 的 延续 。 


(bilboG@george.myerl.example.com) 1> Pid = 

dist demo:start('gandalf@doris.myerl .example.com' ). 
<6790.42.0> 
(bitlbo@Ggeorge.myerl.example.com) 2> 

dist demo:rpc(Pid, file, get cwd, []). 
{ok,"/home/joe/projects/book/]Jaerlang2/Book/code"} 
(bitbo@george.myerl.example,com) 3> 

dist demo:rpc(Pid, file, list dir, ["."]). 
{ok,["adapter dbl.erl","processes.erl", 

"counter.beam","attrs.erl","lib find,.erl",... |]} 

(bitlbo@Ggeorge.myerl.example.com) 4> 

dist demo:rpc(Pid, file, read file, ["dist demo.erl"]). 
{ok,<<"-module(dist demo).\n-export([rpc/4, start/1]).\nNn\n...>>} 


我 在 gandalf 上 启动 了 一 个 分 布 式 Erlang 方 点 ， 位 置 是 我 保存 本 书 代 码 示例 的 code 目 录 。 我 
在 bitbo 上 发 起 的 一 些 请 求 形 成 了 对 gandalf 上 标准 库 的 远程 过 程 调用 。 我 使 用 file 模 块 里 的 三 
个 孔 数 来 访问 gandalf 的 文件 系统 。file:get cwd() 返 回 文件 服务 器 的 当前 工作 目录 ， 
file:list dir(Dir) 返 回 Dir 里 所 有 文件 的 列表 ，file:read file(File) 读 取 文 件 File。 

仔细 回味 一 下 , 你 会 意识 到 刚才 所 做 的 相当 神奇 。 我 们 没有 编写 任何 代码 就 创建 了 一 个 文件 
服务 釉 。 只 是 重用 了 fitLe 模 块 里 的 库 代 码 ， 并 使 它 可 以 通过 一 个 简单 的 远程 过 程 调用 接口 访问 。 

















实现 一 个 文件 传输 程序 

几 年 前 ， 我 需要 在 操作 系统 不 同 的 两 台 联 网 机 器 之 间 传 输 许多 文件 。 我 的 第 一 个 想法 是 
使 用 FTP， 但 这 样 我 就 需要 在 一 台 机 器 上 设置 FTP 服 务 器 ， 在 另 一 台 上 设置 FTP 客 户 端 。 我 找 
不 到 能 用 于 服务 端 机 器 的 FTP 服 务 器 软件 ,而 且 也 没有 安装 FTP 服 务 器 所 需 的 root 权 限 。 我 有 的 
是 在 两 台 机 器 上 运行 的 分 布 式 Erlang。 

我 随后 使 用 的 正 是 这 里 描述 的 技巧 。 不 做 不 知道 ， 编 写 我 自己 的 文件 服务 器 其 至 比 搜索 
并 安装 一 个 FTP 服 务 器 更 快 。 

如 果 有 兴趣 ， 可 以 看 看 当时 我 写 的 博客 "。 


GD http://armstrongonsoftware.blogspot.com/2006/09/why-i-often-implement-things-from.html 
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14.5 ”cookie 保护 系统 


cookie 系 统 让 访问 单个 或 一 组 方 点 变 得 更 安全 。 每 个 廊 点 都 有 一 个 cookie， 如 果 它 想 与 其 他 
任何 节点 通信 ， 它 的 cookie 束 必须 和 对 方 方 点 的 cookie 相 同 。 为 了 确保 cookie 相 同 ， 分 布 式 Erlang 系 
统 里 的 所 有 市 点 都 必须 以 相同 的 “神奇 ”( magic ) cookie 启 动 , 或 者 通过 执行 erlang:set cookie 
把 它们 的 cookie 修 改 成 相同 的 但。 

Erlang 集 群 的 定义 就 是 一 组 市 有 相同 cookie 的 互 连 节 点 。 

两 个 分 布 式 Erlang 节 点 要 相互 通信 ， 就 必须 拥有 相同 的 神奇 cookie。 可 以 用 三 种 方法 设置 


COOKlie。 





注意 ”cookie 保护 系统 被 设计 用 来 创建 运行 在 局 域 网 (LAN ) 上 的 分 布 式 系统 ，LAN 本 身 应 该 
受 防 火 墙 保 护 ,， 与 互联 网 隔 开 。 跨 互联 网 运行 的 分 布 式 Erlang 应 用 程序 应 该 先 在 主机 之 间 
建立 安全 连接 ， 然 后 再 使 用 cookie 保 护 系 统 。 


口 方法 1: 在 文件 $bHOME/ .erlang.cookie 里 存放 相同 的 cookie。 这 个 文件 包含 一 个 随机 字 
符 串 ， 是 Erlang 第 一 次 在 你 的 机 需 上 运行 时 目 动 创建 的 。 
这 个 文件 可 以 被 复制 到 所 有 想 要 参与 分 布 式 Erlang 会 话 的 机 大 上 。 也 可 以 显 式 设置 它 的 
值 。 举 个 例子 ， 我 们 可 以 在 Linux 系 统 上 输入 下 列 命 令 : 
$ cd 
$ cat > .erlang.cookie 
AFRTY1I2ESS3412735ASDF12378 
$ chmod 400 .erlang.cookie 
chmod 让 .erlang.cookie 文 件 只 能 被 它 的 所 有 者 访问 。 

口 方法 2: 当 Erlang 启 动 时 ， 可 以 用 命令 行 参数 -setcookie C 来 把 神奇 cookie 设 成 C。 这 里 有 
一 个 例子 : 


$ erl -setcookie AFRTY12ESS3412735ASDF12378 ... 


口 方法 3: 内 置 子 数 erlang:set cookie(node()，C) 能 把 本 地 节点 的 cookie 设 成 原子 C。 














注意 ”如果 你 的 环境 不 够 安全 ， 那 么 方法 1 和 3 要 优 于 方法 2， 因 为 Unix 系 统 里 的 任何 用 户 都 可 以 
用 ps 命令 来 查看 你 的 cookie。 方 法 2 只 适用 于 测试 。 





为 外 ，cookie 从 不 会 在 网 络 中 明文 传输 ， 它 只 用 来 对 某 次 会 话 进行 初始 认证 。 分 布 式 Erlang 
会 话 不 是 加 密 的 ,但 可 以 被 设置 成 在 加 密 通道 中 运行 。( 可 以 在 Erlang 邮 件 列表 里 搜索 这 方面 的 最 
新 信息 。) 

到 目前 为 止 ， 我 们 已 经 看 到 了 如 何 用 Erlang 广 点 和 基本 的 分 布 式 函数 来 编写 分 布 式 程序 。 作 
为 符 代 方案 ， 也 可 以 编写 基于 原始 套 接 字 接 口 的 分 布 式 程序 。 
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14.6 ”基于 套 接 字 的 分 布 式 模型 


在 这 一 节 里 ， 我 们 将 编写 一 个 基于 套 接 字 的 简单 分 布 式 程序 。 如 你 所 抑 ， 分 布 式 Erlang 适 合 
编写 那些 可 信任 其 他 参与 者 的 集群 应 用 程序 , 但 在 并 非 人 人 都 可 信 的 开放 式 环境 里 , 它 就 不 那么 
适合 了 。 

分 布 式 Erlang 的 主要 问题 在 于 客户 闪 可 以 目 行 决定 在 服务 硕 上 分 裂 出 各 种 进程 。 因 此 ， 要 摊 
毁 你 的 系统 ， 只 需 执 行 下 面 的 命令 : 

rpc:muLticaLt(nodes()，0Ss，cmd，[ ca /; rm -rf *"]) 

分 布 式 Erlang 的 适用 情形 是 你 拥有 全 部 的 机 各 ， 并 日 想 在 单 台 机 帮 上 控制 它们 。 但 如 果 这 些 
机 符 分 别 为 不 同 的 人 所 有 ，, 并 且 他 们 想 要 精确 控制 目 己 的 机 各 可 以 运行 哪些 软件 , 这 种 计算 模型 
就 不 适合 了 。 

在 这 种 情况 下 ， 我 们 将 使 用 一 种 受 限 形式 的 spawn， 让 机 右 的 所 有 者 能 够 显 式 控 制 日 己 机 带 
上 运行 的 程序 。 




















14.6.1 用 lib_chan 控 制 进程 


Lib_chan 模 块 让 用 户 能 够 显 式 控制 目 己 的 机 融 能 分 裂 出 哪些 进程 。Lib_chan 的 实现 相当 复 
杂 ， 所 以 我 把 它 从 普通 章节 里 单独 摘出 来 。 你 可 以 在 附录 B 里 找到 它 。 它 的 接口 如 下 。 














@ -spec start server() -> true 
它 会 在 本 地 主机 上 局 动 一 个 服务 天。 这 个 服务 带 的 行为 由 文件 $HOME/ .erlang_config/ 
Lib chan.conf 决 定 。 








@ -spec start server(Conf}) -> true 
它 会 在 本 地 主机 上 局 动 一 个 服务 益 。 这 个 服务 全 的 行为 由 文件 Conf 决 是 ， 它 包含 一 个 由 
下 列 形 式 的 元 组 所 组 成 的 列表 : 
> {port, NNNN} 
它 会 开始 监听 端口 号 NNNN。 
> {service, S, password, P, mfa, SomeMod, SomeFunc, 90meArg5s95} 
它 会 定义 一 个 被 密码 P 保 护 的 服务 S。 如 采 这 个 服务 局 动 了 , 束 会 通过 分 锦 SomeMod: 
SomeFunc(MM，ArgsC，SomeArgsS) 创 建 一 个 进程 ， 负 责 处 理 来 自 客户 端的 消息 。 
这 里 的 MM 是 一 个 代理 进程 的 PID ， 可 以 用 来 问 客 户 端 发 送 消 息 。 人 参数 Args(C 来 目 于 
客户 痪 的 连接 调用 。 























@ -spec connect(Host, Port, 9 Pp, ArgsC) -> {ok, Pid} | {error, Why} 
尝试 开启 主机 Host 上 的 端口 Port， 然 后 尝试 激活 被 密码 P 保 护 的 服务 5。 如 果 密 人 码 正 确 ， 
就 会 返回 {fok，Pid}+。Pid 是 一 个 代理 进程 的 标识 符 ， 可 以 用 来 向 服务 需 发 送 消 息 。 
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当 客 户 端 调 用 connect/5 建 立 连 接 后 ， 就 会 分 裂 出 两 个 代理 进程 ,一 个 在 客户 端 ， 另 一 个 在 
服务 器 端 。 这 些 代 理 进程 负责 把 Erlang 消 息 转 换 成 TCP 包 数据 ， 捕 捉 来 自控 制 进程 的 退出 信号， 
以 及 套 接 字 关 闭 。 

此 番 解 释 可 能 看 上 去 很 复杂 , 但 使 用 之 后 就 会 变 得 明朗 许多 。 下 面 这 个 完整 的 例子 展示 了 如 
何 将 Lib_chan 与 之 前 描述 的 kvs 结 合 使 用 。 


14.6.2 ”服务 器 代码 
站 和 完 来 编写 一 个 配置 文件 。 


{port, 1234}. 
{service, NameServer, password, "ABXy45", 
mfa, mod name server, start me yup, notUsed}. 


它 的 意思 是 我 们 将 在 自己 机 需 的 1234 端 口上 提供 一 个 名 为 nameServer 的 服务 。 这 个 服务 被 
密码 ABXy45 保 护 。 
当 客 户 端 调用 下 面 的 函数 来 创建 连接 时 : 


connect(Host, 1234, nameServer, "ABXy45", Nil} 

















服务 兹 会 分 裂 mod name server:start me up(MM，niL，notUsed) 。MM 是 一 个 代理 进程 
的 PID ， 用 来 和 客户 端 通信 。 


注意 ”在 这 个 阶段 ， 你 应 当 仔 细 研 读 上 一 行 代码 ， 确 保 明 白 调用 里 的 这 些 参数 来 自 哪里 。 


口 mod name server、start me _ up 和 notUsed 来 自 于 配置 文件 。 
D nil 是 connect 调 用 的 最 后 一 个 参数 。 


mod name server 的 代码 如 下 : 





socket dist/mod _ name server.erl 


-module(mod name server). 
-export([start me up/3]). 


start me up(MM, ArgsC, Arg95) -> 
Loop (MM). 


Loop(MM) -> 
recelive 
{chan, MM, {store, K, V}} -> 
kvs:store(K, V), 
loop (MM); 
{chan, MM, {Lookup, K}} -> 
MM ! {send, kvs:lookup(K)}, 
loop (MM); 
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{chan closed, MM} -> 
true 
end., 


mod_name server 遵 循 以 下 协议 。 

口 如 采 客 户 疹 回 服务 硕 发 送 一 个 消息 {send，X}， 这 个 消息 在 mod_name_server 里 就 会 变 
成 {chan，MM，X} 的 形式 ( MM 是 服务 器 代理 进程 的 PID )。 

口 如 果 客 户 痊 终止 或 者 用 于 通信 的 套 接 字 出 于 任何 原因 关闭 了 ， 服 务 硕 就 会 收 到 一 个 
{chan closed，MM} 形 式 的 消息 。 

口 如 果 服 务 器 想 给 客户 端 发 送 一 个 消息 X， 就 会 通过 调用 MM ! {send，X} 实 现 。 

口 如 采 服 务 右 想 要 显 式 关闭 连接 ， 束 会 通过 执行 MM ! close 实 现 。 

这 个 协议 是 一 个 中 间 人 人 协议， 客户 问 代 人 码 和 服务 带 代 人 码 都 人 如 和 人 循 它 。 本 书 附 录 B 里 的 

“Lib_ chan_mm: 中 间 人 ”一 节 会 更 详细 地 解释 套 接 字 中 间 人 代码 。 

为 了 测试 这 段 代 码 ， 首 先 会 确保 它 能 在 单 侣 机 硕 上 正 滑 工作 。 

现在 可 以 启动 名 称 服务 器 ( 和 kvs 模 块 ) 了 。 

了 > kvs:start(}). 

true 

2> Lib chan:start _ Server () . 


Starting a port server on 1234... 
true 


现在 启动 第 二 个 Erlang 会 话 ， 用 任意 客户 闹 来 测试 它 。 


1> {ok, Pid} = lib_ chan:connect("localhost",1234,nameServer,"ABXy45",""). 

{ok, <0.43.0>} 

2> 1ib chan:cast(Pid, {store, joe, "writing a book"}). 

{send, {store, joe, "writing a book"}} 

3> Lib_ chan:rpc(Pid, {lookup, joe}). 

{ok, "writing a book"} 

4> 1ib chan:rpc(Pid, {lookup, Jim}). 

undefined 

在 单 合 机 硕 上 测试 成 功 之 后 , 我 们 会 按照 之 前 摘 述 的 步骤 , 在 两 台 物 理 隔离 的 机 各 上 执行 类 
似 测 试 。 

请 注意 , 在 这 个 案例 里 , 决定 配置 文件 内 容 的 是 远程 机 各 的 所 有 者 。 配置 文 件 指定 了 哪些 应 
用 程序 是 这 人 台 机 硕 人 允许 运行 的 ， 以 及 哪个 端口 是 用 来 与 这 些 应 用 程序 通信 的 。 

现在 已 经 能 够 编号 分 布 式 程序 了 ,一 个 加 新 的 世界 出 现在 我 们 面前 。 如 采编 写 顺 序 程序 是 一 
种 乐趣 ， 那 么 编写 分 布 式 程序 就 是 乐趣 的 平方 或 者 立方 。 强 烈 建 议 你 完成 下 面 的 YAFS 练 习 ， 它 
的 基本 代码 结构 是 许多 应 用 程序 的 中 心 。 

我 们 已 经 介绍 了 顺序 、 并 发 和 分 布 式 编程 。 在 本 书 下 一 部 分 , 我 们 将 来 看 看 如 何 建立 外 部 语 
言 代 码 的 接口 ， 并 介绍 一 些 主要 的 Erlang 库 ， 以 及 如 何 调试 代码 ， 然 后 了 解 如 何 用 OTP 构 建 原则 
和 库 来 创建 复杂 的 Erlang 系 统 。 
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14.7 ”练习 


(1) 在 同一 主机 上 局 动 两 个 广 点 。 查 询 rpc 模 块 的 手册 页 。 对 这 两 个 市 点 执行 一 些 远 程 过 程 
调用 。 

(2) 重复 上 一 个 练习 ， 这 次 使 用 同一 局 域 网 里 的 两 个 方 点 。 

(3) 重复 上 一 个 练习 ， 这 次 使 用 不 同 网 络 里 的 两 个 节点 。 

(4) 用 Lib_chan 里 的 库 编 写 YAFS ( Yet Another File Server 的 缩写 ， 即 “又 一 个 文件 服务 器 ”)。 
你 会 从 中 学 到 很 多 知识 。 给 你 的 文件 服务 器 诬 加 一 些 “ 装 饰品 ”。 




















编程 库 与 框架 





本 书 的 这 一 部 分 将 涉及 文件 、 套 接 字 和 数据 库 
编程 所 用 到 的 主要 Erlang 库 。 此 外 ， 我 们 还 会 介绍 
调试 技巧 和 OTP 框架 。 





接口 技术 





系统 的 构建 经 常 涉及 建立 接口 , 用 它 将 不 同 语言 编写 的 应 用 程序 与 我 们 的 系统 相连 。 我 们 可 
能 会 使 用 C 来 提高 效率 或 编写 底层 人 硬件 驱动 ， 或 者 集成 一 个 Java、Ruby 或 其 他 语言 编写 的 库 。 可 
以 用 多 种 方式 建立 外 部 语言 程序 与 Erlang 之 间 的 接口 。 

口 让 程序 以 外 部 操作 系统 进程 的 形式 在 Erlang 虚 拟 机 以 外 运行 。 这 是 一 种 安全 的 做 法 。 即 使 

外 部 语言 的 代码 有 问题 ， 也 不 会 让 Erlang 系 统 骨 沉 。Erlang 通 过 一 种 名 为 端口 (port ) 的 
对 象 来 控制 外 部 进程 ,与 外 部 进程 的 通信 则 是 通过 一 个 面 回 字 节 的 通信 信道 。Erlang 负 责 
局 动 和 停止 外 部 程序 ， 还 可 以 监视 它 ， 让 在 它 毅 省 后 重 司 。 外 部 进程 被 称 为 端口 进程 ， 
为 它 是 通过 一 个 Erlang 妆 口 控制 的 。 

口 在 Erlang 内 部 运行 操作 系统 命令 并 捕捉 结 

口 在 Erlang 虚 拟 机 的 内 部 运行 外 部 语言 代码 。 这 涉及 链接 外 部 代码 和 Erlang 虚 拟 机 代码 ， 是 
一 种 不 安全 的 做 法 。 外 部 语言 代码 里 的 错误 可 能 会 导致 Erlang 系 统 朋 演 。 虽 然 它 不 安全 ， 
但 还 是 有 用 的 ， 因 为 这 么 做 比 使 用 外 部 进程 更 高 效 。 

把 代码 链接 到 Erlang 内 核 只 适用 于 C 这 样 能 生成 本 地 目标 代码 的 语言 ， 不 适用 于 Java 这 样 
目 身 拥有 虚拟 机 的 语言 。 

在 这 一 章 里 ， 我 们 将 介绍 如 何 用 端口 和 操作 系统 命令 建立 Erlang 接 口 。 另 外 还 有 一 些 使 用 内 
链 驱 动 (linked-in driver )、 原 生 实 现 困 数 (natively implemented fonction， 人 简称 NIF ) 和 C-node 的 
高 级 接口 技术 。 本 书 不 会 涉及 这 些 高 级 接口 技术 ,但 会 在 本 和 草 后 面 简要 概述 它们 ,并 提供 一 些 参 
考 资料 指引 |。 


15.1 ”Erlang 如 何 与 外 部 程序 通信 


Erlang 通 过 名 为 端口 的 对 象 与 外 部 程序 通信 。 如 果 向 端口 发 送 一 个 消息 ， 此 消息 就 会 被 发 往 
与 妆 口 相连 的 外 部 程序 。 来 目 外 部 程序 的 消息 则 会 变 成 来 目 奖 口 的 Erlang 消 息 。 

对 程序 员 而 言 ， 闯 口 的 行为 就 像 是 一 个 Erlang 进 程 。 你 可 以 回 它 发 送 消 息 ， 可 以 注册 它 〈 就 
像 进程 一 样 )， 诸 如 此 类 。 如 果 外 部 程序 骨 尝 了 ， 就 会 有 一 个 退出 信号 发 送 给 相连 的 进程 。 如 果 
相连 的 进程 挂 了 ， 外 部 程序 就 会 被 天 闭 。 

请 注音 使 用 端口 与 外 部 进程 通信 和 使 用 套 接 字 的 区 别 。 如 果 使 用 端口 ， 它 会 表现 得 像 一 个 
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Erlang 进 程 ， 这 样 束 可 以 链接 它 ， 从 茶 个 朱 程 分 布 式 Erlang 点 回 它 发 送 消息 ， 等 等 。 如 朱 使 用 
套 接 字 ， 就 不 会 表现 出 类 似 进程 的 行为 。 

创建 端口 的 进程 被 称 为 该 端口 的 相连 进程 。 相连 进程 有 其 特殊 的 重要 性 : 所 有 发 往 端 口 的 消 
县 都 必须 标明 相连 进程 的 PED ， 所 有 来 目 外 部 程序 的 消息 都 会 发 往 相 连 进程 。 

在 下 面 这 张 图 里 ,我 们 可 以 看 到 相连 进程 4《C 入 端口 (P ) 和 外 部 操作 系统 进程 之 间 的 关系 。 

















ERTS = Erlang 运 行 时 系统 
C = 与 端口 相连 的 Erlang 进 程 


P= 端口 


要 创建 一 个 端口 ， 就 会 调用 open port， 它 的 说 明 如 下 。 


-shec open port(PortName, [Opt]) -> Port 


其 中 PortName 是 下 列 选 项 中 的 一 个 。 
@ {spawn, Command} 
启动 一 个 外 部 程序 。Command 是 这 个 外 部 程序 的 名 称 。 除 非 能 找到 一 个 名 为 Command 的 内 
链 驱 动 ， 和 否则 Command 会 在 Erlang 工 作 空 间 之 外 运行 。 
© {fd, INn, Out} 
人 允许 一 个 Erlang 进 程 访 问 Erlang 使 用 的 任何 当前 打开 文件 描述 符 。 文 件 描述 符 In 可 以 用 作 
标准 输入 ， 文 件 描述 符 0ut 可 以 用 作 标 准 输出 。 
0pt 是 下 列 选 项 中 的 一 个 。 
© {packet, N} 
数据 包 ( packet ) 前 面 有 N( 1、2 或 4 ) 个 字 节 的 长 度 计 数 。 
@ stream 
发 送 消息 时 不 市 数据 包 长 度 信息 。 应 用 程序 必须 知道 如 何 处 理 这 些 数据 包 。 
© {line, Max} 
发 送 消 息 时 使 用 一 次 一 行 的 形式 。 如 采 有 一 行 超 过 了 Max 字 节 ， 就 会 在 Max 字 下 处 被 折 分 。 
© {cd, Dir} 
只 适用 于 {spawn，Command} 选 项 。 外 部 程序 从 Dir 里 局 动 。 
© {env, Env} 
只 适用 于 {fspawn，Command} 选 项 。 外 部 程序 的 环境 通过 Env 列 表 里 的 环境 变量 进行 扩展 。 
Env 列 表 由 和 奉 干 个 {VarName，VatLue} 对 组 成 ， 其 中 VarName 和 VatLue 是 字符 串 。 
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这 不 是 open_port 的 完整 参数 清单 。 在 erLang 模 块 的 手册 页 里 能 找到 各 个 参数 的 准确 细节 。 
下 列 销 息 可 以 被 发 入 端口 。 请 注意 ， 所 有 这 些 消 息 里 的 PidC 痢 是 相连 进程 的 PID 。 


@ Port ! {PidC, {command, Data 
向 端口 发 送 Data (一 个 LO 列表 )。 


@ Port! {PidC, {connect, PlId1 
把 相连 进程 的 PID 从 PidC 改 为 Pid1。 


@ Port ! {PidC, close} 

关闭 端口 。 

相连 进程 可 以 用 以 下 方式 从 外 部 程序 接收 消息 。 

recelve 

{Port, {data, Data}} -> 
.数据 从 外 部 进程 进来 ..， 
在 接 下 来 的 几 市 里 , 我 们 将 建立 从 Erlang 到 一 个 简单 C 程 序 的 接口 。 我 们 特意 把 这 个 C 程 序 写 
得 简短 ， 目 的 是 不 让 它 干扰 我 们 对 建立 接口 细节 的 关注 。 











15.2 用 端口 建立 外 部 C 程序 接口 


我 们 将 从 一 些 简单 的 C 代 码 开 始 。examplel.c 和 包含 了 两 个 函数 。 第 一 个 函数 计算 两 个 整数 
之 和 ， 第 二 个 函数 计算 参数 的 两 倍 是 多 少 。 


ports/example1.c 


int sum(int x, int y){ 
return x+y,; 


} 


int twice(int x)f{ 
return 2*x, 


} 
我 们 的 最 终 目 的 是 从 Erlang 里 调用 这 些 方法 。 硕 望 能 像 这 样 调用 它们 : 


Xl 
Yl1 


对 用 户 而 言 ，exampLe1 是 一 个 Erlang 模 块 ， 因 此 所 有 与 C 程 序 接口 有 关 的 细节 都 应 该 隐藏 在 
examplel 模 块 内 部 。 

要 实现 它 ， 需 要 把 sum(12,23) 和 twice(10) 这 样 的 郴 数 调用 转变 成 字 节 序列 ， 通 过 端口 发 
送 给 外 部 程序 。 端 口 给 字 节 序列 加 上 长 度 信息 ， 然 后 把 结果 发 给 外 部 程序 。 当 外 部 程序 回复 时 ， 
端口 接收 回复 ， 并 把 结果 发 给 与 端口 相连 的 进程 。 


examplel:sum(12,23), 
examplel:twice(10), 
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所 用 的 协议 非常 简单 。 
口 所 有 数据 包 都 以 2 字 节 的 长 度 代码 ( Len ) 开头 ， 后 接 Len 字 节 的 数据 。 这 个 包头 会 被 端口 
自动 添加 ， 因 为 打开 端口 时 设置 了 参数 {packet ,2}。 

口 把 sum(N，M) 调 用 编码 成 字 节 序列 [1,N,M]。 

口 把 twice(N) 调 用 编码 成 字 节 序列 [2,N] 。 

口 参数 和 返回 值 都 被 假定 为 1] 字 节 长 。 

外 部 C 程 序 和 Erlang 程 序 都 必须 遵循 这 一 协议 。 下 图 演示 了 调用 examplel:sum(12,23) 之 后 
所 发 生 的 事 。 它 展示 了 端口 是 如 何 链接 外 部 C 程 序 的 。 


Erlang : “操作 系统 进程 


{sum,12,23] [1223] [03,1,12.23 i pa 
:35 (ty ) a [35] 9 


整个 过 程 如 下 。 

(1) 驱动 把 函数 调用 sum(12,23) 编 码 成 字 市 序列 [1,12,23] ， 然 后 回 端 口 发 送 {self() 
{command，[1,12,23]}} 消 息 。 

(2) 奖 口 驱动 给 这 个 消息 加 上 2 字 的 长 度 包头 ， 然 后 把 字 节 序列 0,3,1,12,23 发 给 外 部 
程序 。 

(3) 外 部 程序 从 标准 输入 里 读 取 这 5 个 字 节 ， 调 用 sum 函 数 ， 然 后 把 字 节 序列 0,1,35 写 入 标准 




















前 两 个 字 节 包含 了 数据 包 的 长 度 。 接 下 来 是 35 这 个 结果 ， 它 的 长 度 是 1 个 字 市 。 

(4) 端口 驱动 移 除 长 度 包头 ， 然 后 癌 相 连 进程 发 送 一 个 {Port，{data，[35]}} 消 息 。 
(5) 相连 进程 解码 这 个 消息 ， 然 后 把 结果 返回 给 调用 程序 。 

现在 必须 在 接口 的 两 侧 编 写 遵 循 这 一 协议 的 程序 。 








15.2.1 C 程 序 


C 程 序 有 三 个 文件 。 

口 examplel.c: 包含 了 我 们 想 要 调用 的 函数 (之 前 已 经 见 过 它 了 )。 

口 examplel driver.c: 管理 字 节 流 协议 并 调用 examptLel1.c 里 的 方法 。 

口 erl_comm.c: 和 天 有 读 取 和 写 入 内 存 缓冲 区 的 方法 。 

1. examplel driver.c 

这 段 代码 有 一 个 循环 , 它 会 从 标准 输入 读 取 命令 ,调用 应 用 程序 的 方法 ,然后 把 结果 写 和 信 标 
准 输出 。 请 注意 , 如 果 想 要 调试 这 个 程序 , 可 以 让 它 写 人 stderre。 代码 里 有 一 行 注释 挥 的 fprintf 
语句 展示 了 该 怎么 做 。 
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ports/example1_driver.c 


#include <stdio.h> 
#include <stdlib.h> 
typedef unsigned char byte; 


int read cmd(byte *buff),; 

int write cmd(byte *buff, int len); 
int sum(int x, int y); 

int twice(int x); 


int main() f{ 
int fn, argl, arg2, result; 
byte buff[100]; 


while (read cmd(buff) > 0) { 
fn = buff[0]; 


if (fn == 1) 1{ 
argl = buff[1]; 
arg2 = buff[2]; 


/* 调试 ， 可 以 打印 到 stderr 来 调试 
forintf(stderr,"calling sum %1 %i\n",argl,arg2); */ 

result = sum(argl, arg2); 

+ else if (fn == 2) 1{ 
argl = buff[1]; 
result = twice(argl); 

} else 1 
/* 碰 到 未 知 孙 数 就 直接 退出 */ 
exit (EXIT FAILURE); 

} 

buff[0] = result, 

write cmd(buff, 1); 

} 
} 


2. erl comm.c 


最 后 是 从 标准 输入 和 输出 里 谈 取 和 写 人 数据 的 代码 。 这 段 代码 允许 数据 出 现 可 能 的 





ports/erl_comm.c 


/*+ erl comm.c */ 
#include <unistd.h> 
typedef unsigned char byte; 


int read cmd(byte *buf); 

int write cmd(byte *buf, int len); 
int read exact(byte *buf, int len); 
int write exact(byte *buf, int Len) ; 
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int read cmd(byte *buf) 
{ 
int len; 
if (read exact(buf, 2) != 2) 
return(-1); 
len = (buf[90] << 8) | buf[1]; 
return read exact(buf, len),; 
和 
int write cmd(byte *buf, int len) 
{ 
byte LI; 
li = (len >> 8) & QOxff; 
write exact(&li, 1); 
li = len & Oxff; 
write exact(&li, 1); 
return write exact(buf, len); 
} 
int read exact(byte *buf, int len) 
{ 
int i, got=0; 
do 1{ 
if ((i = read(0, buf+got, len-got)) <= 0) 
return(i)}).; 
got += 工 ; 
} while (got<Len) ; 
return( len); 
} 
int write exact(byte *buf, int len) 
{ 
int i, wrote = 0 
do 1{ 
If ((i = write(l1, buf+wrote, len-wrote)) <= 0) 
return (1); 
wrote += 工 ; 
} while (wrote<Len) ; 
return (Len) ; 


} 


这 段 代 人 码 专 门 用 于 处 理 珊 有 2 字 节 长 度 包 头 的 数据 ， 因 此 它 与 提供 给 端口 驱动 程序 的 
{packet，2} 选 项 匹配 。 





15.2.2 ”Erlang 程 序 
端口 的 Erlang 一 侧 由 下 面 这 个 程序 驱动 : 
ports/example1.erl 


-moduLetexampLel) ， 
-export([start/0, stop/0]). 
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-export( [twice/l1, sum/2]). 


start() -> 
register (examplel, 
spawn (fun() -> 
process flag(trap exit, true), 
Port = open port({spawn, "./examplei"}, [{packet, 2}]), 
loop(Port) 
end)). 
stop() -> 


?MODULE ! stop， 
twice(X) -> call port({twice, X})., 
SUM(X,Y) -> call port({sum, X, Y}). 
call port(Msg) -> 

?MODULE ! {call, self(), Msg}, 

receive 

{?MODULE, Result} -> 
Result 
end. 


loop(Port) -> 
receive 
{call, Caller, Msg} -> 
Port ! {self(), {command, encode (Msg)}}, 
receive 
{Port, {data, Data}} -> 
Caller ! {?MODULE, decode (Data)} 
end, 
loop (Port), 
stop -> 
Port ! {self()}, closel}, 
receive 
{Port, closed} -> 
exit (normal) 
end ; 
{'EXIT', Port, Reason} -> 
exit({port terminated, Reason}) 
end ， 


encode({sum, X, Y}) -> [1, XxX, Y]; 
encode({twice, X}} -> [2, X]., 


decode( [Int]j) -> Int. 

这 段 代码 遵循 一 个 相当 标准 的 模式 。 我 们 在 start/0 里 创建 了 一 个 名 为 example1 的 注册 进 
程 (服务 大 )。call port/1 实 现 了 对 服务 上 磊 的 远程 过 程 调 用 。twice/1 和 sum/2 是 接口 方法 , 它 
们 必须 被 导出 ， 会 对 服务 硕 发 起 远程 过 程 调用 。 我 们 在 Loop/1 里 编码 了 对 外 部 程序 的 请 求 ， 并 
将 来 目 外 部 程序 的 返回 值 做 了 适当 处 理 。 
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程序 已 经 编写 完成 。 现 在 需要 的 就 是 一 个 构建 程序 的 makefile。 
15.2.3 ”编译 和 链接 端口 程序 


这 个 makefile 会 编译 并 链接 本 章 描 述 的 端口 驱动 和 内 链 驱 动 程序 ， 以 及 所 有 相关 的 Erlang 代 
人 码 。 这 个 makefile 只 在 Mac OSX“ 美 洲 狮 ”系统 上 测试 过 ， 其 他 操作 系统 需要 进行 修改 。 它 还 包 
含 一 个 小 型 测试 程序 ， 每 次 代码 重建 时 都 会 运行 。 





ports/Makefile.mac 


‘SUFFIXES: .erl .beam .yrl 


.rl .beam: 
erlc -W $< 


MODS = examplel examplel Lid unit test 


all; ${MODS :%=% .beam} examplel examplel drv,So 
GerL -noshell -s unit test start 
examplel: examplel.c erl comm.c examplel driver.c 
gcc -0 examplel examplel.c erl comm.c examplel driver.c 
examplel drv.so: examplel lid.c examplel.,c 
gcc -arch i386 -1 /usr/local/lib/erlang/usr/include\ 
-0 éxamplel drv.so -fPIC -bundle -flat namespace -undefined suppress\ 
examplel.c examplel] lid.c 
clean: 
rm examplel examplel drv.so *.beam 


15.2.4 ”运行 程序 
现在 可 以 运行 程序 了 。 


了 > exampLel:start( ) . 





true 

2> examplel:sum(45, 32). 
77 

4> examplel:twice(10). 
20 


这 样 就 完成 了 我 们 的 第 一 个 范例 端口 程序 。 这 个 程序 实现 的 端口 协议 是 Erlang 与 外 部 世界 通 
信 的 主要 做 法 。 
进入 下 一 个 话题 之 前 ， 请 注意 以 下 几 点 。 
口 示例 程序 没有 尝试 去 统一 Erlang 和 C 里 的 整数 概念 。 只 是 假定 Erlang 和 C 里 的 整数 都 是 一 个 
字 方 ， 同 时 忽略 了 所 有 的 精度 和 符号 问题 。 在 现实 程序 里 ， 必 须 认 真 考虑 相关 参数 的 准 
确 类 型 和 精度 。 事 实 上 ,这 可 能 是 相当 困难 的 ， 因 为 Erlang 很 轻松 地 就 能 管理 任意 大 小 的 




















196 第 15 革 接口 技术 





整数 ， 而 C 这 样 的 语言 对 整数 的 精度 和 其 他 方面 都 有 着 严格 的 要 求 。 
D 必须 首先 启动 负责 接口 的 驱动 才能 运行 Erlang 函 数 ( 也 就 是 说 ， 必 须 有 程序 先 执行 
examplel: start () ， 然 后 才能 运行 程序 ) 我 们 希望 能 在 系统 启动 时 自动 完成 这 项 工作 。 
这 是 完全 可 以 实现 的 ,但 需要 有 一 定 的 系统 启动 和 停止 知识 ,我 们 将 在 23.7 节 中 处 理 这 件 事 。 


15.3 在 Erlang 里 调用 shell 脚本 


假设 想 要 在 Erlang 里 调用 一 个 shell 脚 本 。 要 做 到 这 一 点 ， 可 以 使 用 库 困 数 os:cmd(Str)。 它 
会 运行 字符 串 Str 里 的 命令 并 捕捉 结果 。 这 里 有 一 个 使 用 ifconfig 命 令 的 例子 : 


1> os:cmd("ifconfig"). 
"Lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 16384\n\t... 


这 个 结 灯 需要 先 解析 才能 提取 出 我 们 感 兴趣 的 信息 。 


15.4 高 级 接口 技术 


除了 之 前 讨论 的 那些 技术 ， 建 立 Erlang 到 外 部 程序 的 接口 还 有 一 些 额外 的 技术 可 用 。 
接 下 来 介绍 的 这 些 技术 正在 不 断 改进 ， 变 化 之 快 往往 超过 Erlang 肯 身 的 演变 速度 。 出 于 这 个 
原因 , 这 里 不 会 详细 描述 它们 。 我 们 把 摘 述 转移 到 了 在 线 存 档 里 , 这 样 它们 就 能 得 到 更 及 时 的 更 新 。 
@ 门 链 驱 动 
这 些 程序 和 之 前 讨论 的 并 口 驱动 齐 循 相同 的 协议 ， 唯 一 的 区 别 是 它们 的 驱动 代码 被 链接 
到 Erlang 内 核 中 ， 因 此 会 在 Erlang 的 操作 系统 主 进程 内 运行 。 要 构建 一 个 内 链 驱 动 ， 就 必 
须 添 加 少量 代码 来 初始 化 它 ， 张 动 本 号 必须 被 编 谋 和 链接 到 Erlang 虚 拟 机 上 。 
git://github.com/erlang/linked in drivers.git 里 有 最 新 的 内 链 驱 动 范 例 ， 还 介 
绍 了 如 何在 各 种 操作 系统 上 编译 它们 。 
@ NIF 
NIF 是 指 原生 实现 函数 ( Natively Implemented Function )。 这 些 困 数 是 用 C (或 其 他 能 编译 
成 本 地 代码 的 语言 ) 编写 的 , 并 且 被 链接 到 Erlang 虚 拟 机 中 。NIF 直 接 将 参数 传递 到 Erlang 
进程 的 栈 上 ， 还 能 下 接 访 问 所 有 的 Erlang 内 部 数据 结构 。 
git://github.com/erLang/nifs.git 提 供 了 NIE 的 范例 和 最 新 信息 。 
@ C-node 
C-node 是 用 C 实 现 的 节点 ， 它 们 遵循 Erlang 分 布 式 协议 。 一 个 “真正 的 ”分 布 式 Erlang 下 
点 不 仅 能 够 与 Cnode 通 信 ， 还 会 把 它 当 作 一 个 Erlang 节 点 〈 前 提 是 它 不 在 C-node 上 做 一 些 
花哨 的 事情 ， 比 如 发 送 Erlang 代 人 码 让 它 执行 )。 
http://www.erlang.org/doc/tutorial/introduction.html 里 的 互 操 作 性 教程 对 C-node 做 了 介绍 。 
现在 我 们 已 经 了 解 了 如 何 设立 Erlang 对 外 部 世界 的 接口 。 接 下 来 的 几 和 曹 将 介绍 如 何在 Erlang 
里 访问 文件 和 和 套 接 字 。 
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15.5 ”练习 


(1) 下 载 之 前 给 出 的 端口 驱动 代码 ， 然 后 在 你 的 系统 上 测试 它 。 

(2) 打开 git://github.com/erLang/Linked in drivers.git, 下 载 内 链 驱 动 的 代码 并 在 
你 的 系统 上 测试 。 这 里 的 难点 是 找到 编译 和 链接 代码 的 正确 命令 。 如 果 不 能 完成 这 个 练习 ， 可 以 
去 Erlang 邮 件 列 表 寻 求 帮助 。 

(3) 看 看 能 否 找到 一 个 操作 系统 命令 ， 用 它 查 看 你 的 计算 机 使 用 的 是 哪 种 CPU。 如 采 能 找 
到 这 样 的 命令 , 请 编写 一 个 函数 来 返回 你 的 CPU 类 型 , 做 法 是 用 os : cmd 天 数 调用 这 个 操作 系统 
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在 本 章 ， 我 们 将 来 看 一 些 最 常用 的 文件 操作 也 数 。 标 准 版 Erlang 拥 有 大 量 的 文件 处 理 函 数 ， 
我 们 将 把 重点 放 在 其 中 的 一 小 部 分 上 。 我 编写 的 大 多 数 程 序 都 用 到 了 它们 ,同样 ,你 也 会 频繁 地 
使 用 它们 ,还 会 看 一 些 编写 高 效 文 件 处 理 代码 的 技巧 示例 ,并 简要 介绍 一 些 不 太 和 常用 的 文件 操作 ， 
让 你 知道 它们 的 存在 。 如 果 想 了 解 这 些 冷 门 技巧 的 更 多 细节 ， 请 参阅 手册 页 。 

我 们 将 把 重点 放 在 以 下 领域 : 

口 概述 用 于 操作 文件 的 主要 模块 ; 

口 读 取 文 件 的 不 同方 法 ; 

口 写 和 文件 的 不 同方 法 ; 

口 目录 操作 ; 

口 查找 文件 的 信息 。 


16.1 














操作 文件 的 模块 


用 于 文件 操作 的 函数 被 归 为 四 个 模块 。 


file 

它 包 含 打 开 、 关 闭 、 读 取 和 写 入 文件 的 方法 ， 还 有 列 出 目录 ， 等 等 。 表 7 人 简要 展示 了 一 些 
最 和 常用 的 file 函 数 。 要 了 解 所 有 的 细节 ， 请 参阅 file 模 块 的 手册 页 。 

filename 

这 个 模块 里 的 方法 能 够 以 器 平台 的 方式 操作 文件 名 ， 这 样 就 能 在 许多 不 同 的 操作 系统 上 
运行 相同 的 代码 了 。 

filelib 

这 个 模块 是 filLe 的 扩展 。 它 包含 的 许多 工具 因数 能 够 列 出 文件 、 检 查 文 件 类 型 ， 等 等 。 
其 中 大 多 数 都 是 使 用 fiLe 里 的 函数 编写 的 。 

10 

这 个 模块 有 一 些 操 作 已 打开 文件 的 方法 。 它 包含 的 方法 能 够 解析 文件 里 的 数据 ， 或 者 把 
格式 化 数据 写 入 文件 。 
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16.2 ” 读 取 文件 的 几 种 方 } 


让 我 们 来 看 看 读 取 文件 方面 有 什么 选择 。 首 先 将 编写 5 个 小 程序 ， 它 们 会 打开 一 个 文件 ， 然 
后 用 多 种 方式 读 取 数据 。 

文件 的 内 容 仪 仪 是 一 个 字 市 序列 。 它 们 是 否 有 意义 取决 于 对 这 些 字 市 的 解读 。 

为 了 演示 这 一 点 ， 我 们 将 在 所 有 示例 里 使 用 同一 个 输入 文件 。 它 实际 上 包含 一 个 由 各 种 
Erlang 数 据 类 型 组 成 的 序列 , 根据 打开 和 读 取 文件 方式 的 不 同 , 里 面 的 内 容 可 以 解读 成 一 个 Erlang 
数据 类 型 序列 ， 一 个 文本 行 序列 ， 或 者 没有 特定 意义 的 原始 二 进 制 数 据 块 。 

这 里 是 文件 里 的 原始 数据 : 

















data1.dat 


{person, "joe", "armstrong", 
[{occupation, programmer}, 
{favoriteLanguage, erlang}|]}. 


{cat, {name, "zorro"}, 
{owner, "joe"}}. 


现在 我 们 将 用 多 种 方法 读 取 这 个 文件 的 各 个 部 分 。 
16.2.1 读 取 文件 里 的 所 有 数据 类 型 


datal.dat 包 含 一 个 由 各 种 Erlang 数 据 类 型 组 成 的 序列 ,可 调用 file:consult 来 读 取 所 有 的 
数据 类 型 ， 就 像 下 面 这 样 : 
1> file:consult("datal.dat"). 
{ok, [{person,"joe", 
"armstrong", 


[{occupation,programmer},{favoriteLanguage,erlang}]}, 
{cat, {name, "zorro"}, {owner,"]Joe"}}]} 


file:consult(File) 假 定 File 包 含 一 个 由 Erlang 数 据 类 型 组 成 的 序列 。 如 果 它 能 读 取 文件 
里 的 所 有 数据 类 型 ， 就 会 返回 {ok，[Term]}， 否 则 会 返回 {error，Reason}。 


表 7 ”文件 操作 摘要 (file 模块 ) 


函数 描 述 
change _ group 修改 某 个 文件 所 属 的 组 
change_owner 修改 某 个 文件 的 所 有 者 
change time 修改 某 个 文件 的 最 后 修改 或 访问 时 间 
close 关闭 某 个 文件 





consult 从 某 个 文件 里 读 取 Erlang 数 据 类 型 
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( 续 ) 
范 数 摘 人 述 
copy 复制 文件 内 容 
del dir 删除 某 个 目录 
delete 删除 某 个 文件 
eval 执行 某 个 文件 里 的 Erlang 表 达 式 
format error 返回 一 个 描述 错误 原因 的 字符 串 
get_cwd 获取 当前 工作 目录 
List dir 列 出 某 个 目录 里 的 文件 
make dir 创建 一 个 目录 
make link 创建 指向 某 个 文件 的 硬 链接 ( hard link ) 
make_symlink 创建 指向 某 个 文件 或 目录 的 符号 链接 (symbolic link ) 
open 打开 某 个 文件 
position 设立 在 文件 里 的 位 置 
pread 对 文件 里 的 某 个 位 置 进 行 读 取 
pwrite 对 文件 里 的 茶 个 位 置 进行 写 信 
read 对 某 个 文件 进行 读 取 
read file 读 取 整个 文件 
read file info 获取 某 个 文件 的 信息 
read_Link 获得 某 个 链接 指 癌 的 位 置 
read link info 获取 某 个 链接 或 文件 的 信息 
rename 重 命 名 某 个 文件 
script 执行 并 返回 某 个 文件 里 Erlang 表 达 式 的 值 
set_ cwd 设置 当前 工作 目录 
sync 同步 某 个 文件 在 内 存 和 物理 介质 中 的 状态 
truncate 截断 某 个 文件 
write 对 某 个 文件 进行 写 入 
write file 写 和 整个 文件 
write file info 修改 某 个 文件 的 信息 


16.2.2 分 次 读 取 文件 里 的 数据 类 型 

如 果 想 从 文件 里 一 次 读 取 一 个 数据 类 型 ， 就 要 首先 用 file:open 打 开 文 件 ， 然后 用 io: read 
逐个 读 取 数据 类 型 ， 直 到 文件 未 尾 ， 最 后 再 用 fite:ctose 关 闭 文件 。 

这 个 shell 会 话 展示 了 从 文件 里 一 次 读 取 一 个 数据 类 型 时 会 发 生 什么 : 
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1> {ok, S} = file:open("datal.dat", read). 
{ok,<0 .36.0>} 
2> io:read(S, ''). 
{ok, {person,"]Jjoe", 
"armstrong", 
[{occupation,programmer}, {favoriteLanguage,erlang}]}} 
3> lo:read(S, ''). 
{ok, {cat, {name,"zorro"}, {owner,"joe"}}} 
4> io:read(S, ''). 
eof 
5> file:close(S). 
ok 


此 处 使 用 的 函数 如 下 。 
@ -spec file:open(File, read) -> {ok, IoDevice} | {error, Why} 
洋 试 打开 File 进 行 读 取 。 如 采 它 能 打开 文件 就 会 返回 {ok,，IoDevice} ,否则 返回 {error， 
Reason}。IoDevice 是 一 个 用 来 访问 文件 的 1/O 对 象 。 
@ -spec io:read(IToDevice, Prompt) -> {ok, Term} | {error,Why} | eof 
从 IoDevice 读 取 一 个 Erlang 数 据 类 型 Term。 如 果 IoDevice 代 表 一 个 被 打开 的 文件 ， 
Prompt 就 会 被 忽略 。 只 有 用 io: read 谈 取 标 准 输入 时 ， 才 会 用 Prompt 提 供 一 个 提示 人 符 。 
@ -spec fille:close(IoDevice) -> ok | {error, Why} 
关闭 IoDevice。 
可 以 用 这 些 方法 实现 上 一 节 里 使 用 过 的 file:consult。,file:consult 可 以 用 如 下 方式 定 








lib_misc.erl 


consult(File) -> 
case file:open(File, read) of 
{ok, S} -> 
Val = consuyult]1(S), 
file:close(Ss), 
{ok, Val}; 
{error, Why} -> 
{error, Why} 
end. 
COnSuLt1(9) -> 
case lo:read(9，'') of 
{ok, Term} -> [Term|consyult1(S)]; 
eof -> []; 
Error -> Error 
end. 


不 过 ，filLe:consutLt 其 实 不 是 这 么 定义 的 。 标 准 库 所 用 的 是 一 个 改进 版 ， 有 看 更 好 的 错误 








报告 能 力 。 


现在 是 查看 标准 库 所 用 版 本 的 一 个 好 时 机 。 如果 你 能 理解 刚才 的 版 本 , 那么 理解 库 里 的 代码 
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就 很 容易 了。 问题 只 有 一 个 : 我 们 需要 找到 file .erl 的 源 代码 。 可 使 用 code:which 吻 数 来 找到 
它 ， 该 函数 能 定位 所 有 已 载 人 模块 的 目标 代码 。 


1> code:which(file). 
"/usr/local/lib/erlang/lib/kernel-2.16.1/ebin/file.beam" 


在 标准 分 发 侠 痰 里 , 每 个 库 都 有 两 个 子 日 录 。 一 个 名 为 src, 包含 源 代码 ; 为 一 个 名 为 ebin， 
包含 编译 后 的 Erlang 代 码 。 因 此，fite.ert 的 源 代码 应 该 是 在 下 面 这 个 目录 里 : 

/usr/local/lib/erlang/lib/kernel-2.16.1/src/file .erl 

当 其 他 路 都 走 不 通 , 手册 页 也 不 能 提供 你 想 知 道 的 代码 问题 答案 时 , 快速 浏览 一 下 源 代码 通 
津 可 以 帮 你 找到 答案 。 我 知道 这 不 应 该 发 生 , 但 我 们 都 是 人 , 有 时 修文 档 的 确 无 法 回答 你 的 所 有 
疑 问 O 〇 

















16.2.3 分 次 读 取 文件 里 的 行 


如 条 把 io: read 改 成 io:get_ Line， 就 可 以 分 次 谈 取 文件 里 的 行 。io:get_Line 会 一 直 旋 取 
字符 ， 直 到 遇 上 换行 符 或 者 文件 尾 。 这 里 有 一 个 例子 : 


1> {ok, S} = file:open("datal.dat", read). 
{ok,<0.43.0>} 

2> lio:get line(S, ''). 

"{person, \"joe\", \"armstrong\",\nNn" 
3> 10:get line(S, ''). 
"\t[{occupation, programmer},\n" 

4> 10:get line(S, ''). 

"At {favoriteLanguage, erlang}]}.\n" 
5> 10:get line(S, '')., 

ANnn 

6> 10:get line(S, ''). 

"{cat, {name, \"zorro\"},\nNn" 

7> lo:get line(S, ''). 

a {owner, \"joe\"}}.\n’" 

8> io:get line(S, ''). 

eof 

9> file:close(S). 

ok 


16.2.4” 读 取 整 个 文件 到 二 进 制 型 中 


可 以 用 file:read file(File) 把 整个 文件 读 入 一 个 二 进 制 型 ， 这 是 一 次 原子 操作 。 


1> file:read file("datal.dat"). 
{ok,<<"{person, \"joe\", \"armstrong\""...>>} 


如 果 成 功 ，file:read file(File) 就 会 返回 {ok，Bin}， 否 则 返回 {error，Why}。 这 是 
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到 目前 为 止 最 高 效 的 文件 读 取 方式 ,我 经 常用 它 。 在 大 多 数 操作 里 ,我 会 把 整个 文件 一 次 性 该 入 
内 存 ， 然 后 操作 内 容 并 一 次 性 保存 文件 (用 fite:write file )。 后 面 会 给 出 一 个 例子 。 





16.2.5 ”通过 随机 访问 读 取 文件 


如 有 果 想 要 读 取 的 文件 非 第 大 ,或 者 它 包 含 某 种 外 部 定义 格式 的 二 进 制 数 据 ， 就 可 以 用 raw 柑 
式 打 开 这 个 文件 ， 然 后 用 file:pread 读 取 它 的 任意 部 分 。 

这 里 有 一 个 例子 : 

1> {ok, S} = file:open("datal.dat", [read,binary ,raw]). 

{ok, {file descriptor, prim fite, {#Port<0.106>,5}}} 

2> file:pread(S, 22, 46). 

{ok,<<"rong\",\n\t[{{occupation, programmer},\n\t {favorite">>} 

3> file:pread(S$, 1, 10). 

{ok,<<"person, \"] ">>} 

4> file:pread(S, 2，10). 

{ok,<<"erson, \"ij0">>} 

5> file:close(S). 

ok 

file:pread(IoDevice，Start，Len) 会 从 IoDevice 访 取 Len 个 字 节 的 数据 ， 读 取 起 点 是 
字 有 Start 处 (文件 里 的 宇 节 会 被 编号 , 所 以 文件 里 第 一 个 字 广 的 位 置 是 0 ), 它 会 返回 {ok,，Bin} 
或 者 {ferror，Why}。 

最 后 ， 用 这 些 随机 文件 访问 函数 来 编写 一 个 工具 亲 数 ， 下 一 草 将 会 用 到 它 。 在 17.6 节 里 ,我 
们 将 开发 一 个 简单 的 SHOUTcast 服 务 右 〈 它 是 一 个 针对 所 谓 流 媒体 的 服务 磊 ， 在 这 个 案例 里 是 
MP3 流 )。 这 个 服务 需 的 要 求 之 一 是 能 找 出 内 般 在 MP3 文 件 里 的 艺术 家 和 曲目 名 。 我 们 将 在 下 一 
节 实 现 它 。 

读 取 MP3 元 数据 

MP3 是 一 种 二 进 制 格式 , 用 来 保存 压缩 过 的 音频 数据 。MP3 文 件 本 吴 并 不 包含 有 关 文 件 内 容 
的 信息 。 比 如 说 , 在 一 个 包含 音乐 数据 的 MP3 文 件 里 , 音频 数据 并 不 包含 录制 音乐 的 艺术 家 姓名 。 
这 类 数据 (曲目 名 和 艺术 家 姓名 等 ) 以 一 种 被 称 为 ID3 的 标签 块 格式 保存 在 MP3 文 件 中 。ID3 标 签 
是 由 一 位 名 叫 Eric Kemp 的 程序 员 发 明 的 ， 用 来 保存 描述 首 频 文件 内 容 的 元 数据 。ID3 格 式 实际 上 
有 很 多 种 , 但 基于 我 们 的 目的 , 这 里 只 会 编写 代码 来 访问 ID3 标 签 的 两 种 最 简单 的 形式 ， 即 ID3vl 
和 ID3v1.1 标 签 。 

ID3v1 标 签 的 结构 很 简单 : 文件 最 后 的 128 个 字 市 包含 了 一 个 固定 长 度 的 标签 。 前 三 个 字 节 包 
含 ASCII 字 符 TAG， 接 下 来 是 一 些 固定 长 度 的 字段 。 整 个 128 字 节 数 据 是 按照 以 下 方式 打包 的 : 


























3 包含 TAG 字符 的 标签 头 
30 标题 


30 艺术 家 
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( 续 ) 
长 度 内 容 
30 专辑 
4 年 份 
30 备注 
1 流派 


ID3v1 的 标签 里 没有 地 方 可 以 添加 曲目 编号 。Michael Mutschler 在 ID3v1.1 格 式 里 建议 了 一 种 
做 法 ， 把 30 个 字 市 的 备注 字段 改 成 下 面 这 样 : 





长 度 内 容 
> 评论 
1 0〈 一 个 零 ) 
1 曲目 编号 


很 容易 就 能 编写 一 个 程序 来 尝试 谈 取 MP3 文 件 里 的 ID3v1 标 签 ， 然 后 用 二 进 制 位 匹配 霹 法 来 
匹配 这 些 字 段 。 下 面 就 是 这 个 程序 : 


id3 V1.erl 


-module(id3 v1)., 

-import(lists, [filter/2, map/2, reverse/1]). 
-export([test/0, dir/l1, read id3 tag/1]). 
test() -> dir("/home/joe/music keep"). 


dir(Dir) -> 
Files = Lib find:files(Dir, "*.mp3", true), 
Ll = map(fun(I) -> 
{I, (catch read 1d3 tag(I1))} 
end, Files), 
%% Ll1 = [{File, Parse}], 其 中 Parse = error | [{Tag,Val}]。 
%% 现在 必须 把 所 有 Parse = error 的 条 目 从 L 里 移 除 ， 
%% 可 以 用 一 次 fiLter 操 作 实 现 。 
L2 = filter(fun({ ,error}) -> false; 
(_) -> true 
end,，L1),， 
Lib misc:dump ("mp3data", L2). 


read 1d3 tag(File) -> 
case file:open(File, [read,binary,raw]) of 
{ok, S} -> 
Size = filelib:file size(File), 
{ok, B2} = file:pread($, Size-128, 128), 
Result = parse v1 tag(B2) ， 
fiLe:cLose(9) ， 
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Result,; 
_Error -> 
error 
end . 
parse vl] tag(<<$T, $A,$G, 
Title:30/binary, Artist:30/binary, 
Album:30/binary, Year:4/binary, 
_Comment:28/binary, 0:8,Track:8, Genre:8>>) -> 
{"TID3v1,1", 
[{track,Track}, {title,trim(Title)}, 
{artist,trim(Artist)}, {album, trim(ALbum)}]}; 
parse v1] tag(<<$T, $A, $0G, 
Title:30/binary, Artist:30/binary, 
AlLbum:30/binary, Year:4/binary, 
_Comment:30/binary, Genre:8>>) -> 
{"1D3v1", 
[{title,trim(Title)}, 
{artist,trim(Artist)}, {album, trim(ALbum})}]}; 
parse v1] tag( ) -> 
error ， 


trim(Bin) -> 
list to binary(trim bLanks(binary to list(Bin))). 
trim blanks(X) -> reverse(skip blanks and zero(reverse(X))). 


skip blanks and zero([$\s|T]) -> Skip blanks and zero(T); 
skip blanks and zero([90|T]) -> Skip blanks and zero(T),; 
skip blanks and zero(X) -> X, 

个 程序 的 主 入 口 点 是 id3_v1:dir(Dir)。 所 做 的 第 一 件 事 是 调用 Llib find:find(Dir， 
"*.mp3" ,true) (将 在 16.6 市 进行 演示 ) 来 找 出 所 有 的 MP3 文 件 ， 它 会 逐 级 扫描 Dir 里 的 目录 并 
寻找 MP3 文 件 。 

找到 文件 之 后 ， 调 用 read_id3 tag 来 解析 标签 。 解 析 的 任务 被 大 大 简化 了 ， 因 为 只 需 用 位 
匹配 语法 就 能 完成 它 。 然 后 就 可 以 移 除 给 字符 串 定 界 的 尾部 空 日 和 补 等 字符 来 整理 艺术 家 与 曲 日 
名 。 最 后 ， 把 结果 转 储 到 一 个 文件 里 ， 供 以 后 使 用 (21.6.2 节 里 描述 了 Lib misc:dump )。 

大 多 数 首 乐 文件 都 市 有 ID3v1 标 签 ， 哪怕 它们 同时 还 有 ID3v2、v3 和 v4 标签 也 会 如 此 。 后 面 
这 些 标签 标准 会 向 文件 开头 ( 偶尔 也 会 向 文件 中 部 ) 添加 一 个 不 同 格式 的 标签 。 标 签 程序 经 常会 
既 添 加 ID3v1 标 签 ， 又 回 文件 开头 添加 额外 的 标签 〈 它们 更 难以 谈 取 )。 从 我 们 的 目的 出 发 ， 这 里 
只 关心 包含 有 效 ID3v1 和 ID3v1.1 标 签 的 文件 。 

了 解 如 何 谈 取 文件 之 后 ， 现 在 可 以 来 看 看 各 种 写 人 文件 的 方式 了 。 


16.3 ”与 入 文件 的 各 种 方式 
写 入 文件 所 涉及 的 操作 和 读 取 文件 基本 相同 。 我 们 来 了 解 一 
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16.3.1 把 数据 列表 写 入 文件 


假设 想 要 创建 一 个 能 用 file:consult 读 取 的 文件 。 标 准 库 里 实际 上 并 没有 这 样 的 函数 ， 所 
以 我 们 将 目 己 编写 它 。 不 妨 把 这 个 函数 称 为 unconsult。 





lib_misc.erl 


unconsult(File, L) -> 
{ok, S} = file:open(File, write), 
lists:foreach(fun(X) -> io:format(S, "~p.~n",[X]) end, L), 
file:close(S). 


可 以 在 shell 里 运行 它 来 创建 一 个 名 为 test1.dat 的 文件 。 


1> Lib misc:unconsult("test1.dat", 
[{cats, ["zorrow","dalsy"]}, 
{weather ,snowing}]). 





ok 

我 们 来 检查 一 下 能 不 能 用 。 

2> file:consult("testl1.dat"). 

{ok, [{cats,["zorrow","daisy"]},{weather,snowing}]} 

unconsult 以 write 模 式 打 开 文 件 ， 然 后 调用 io:format(S,， "~p.~n"，[X]) 来 把 数据 类 型 
写 入 文件 。 

io:format 承 担 了 创建 格式 化 输出 的 重任 。 要 生成 格式 化 输出 ， 我 们 会 做 以 下 调用 。 


-spec io:format(loDevice, Format, Args) -> ok 


其 中 ioDevice 是 一 个 LO 对 象 (必须 以 write 模式 打开 )，Format 是 一 个 包含 格式 代码 的 字 

符 串 ，Args 是 待 输出 的 项 目 列表 。 

Args 里 的 每 一 项 都 必须 对 应 格式 字符 串 里 的 某 个 格式 命令 。 格 式 命令 以 一 个 波浪 字符 (~ ) 

开头 。 这 里 有 一 些 最 常用 的 格式 命令 。 

口 ~n 输 出 一 个 换行 符 。~n 很 智能 ， 会 输出 一 个 符合 平台 标准 的 换行 符 。 比 如 说 ，~n 在 Unix 
机 器 上 会 把 ASCII ( 10 ) 写 人 输出 流 ， 在 Windows 机 器 上 则 会 把 回 车 换行 ASCII ( 13, 10 ) 
写 人 输出 流 。 

口 ~p 把 参数 打印 为 美观 的 形式 。 

口 ~s 人 参数 是 一 个 字符 串 、IO 列 表 或 原子 ， 打 印 时 不 带 引 号 。 

口 ~w 用 标准 语法 输出 数据 。 它 被 用 于 输出 各 种 Erlang 数 据 类 型 。 

格式 字符 串 大 概 有 几 亿 个 参数 ， 一 个 正常 思维 的 人 是 记 不 住 的 。 可 以 在 io 模块 的 手册 页 里 

找到 完整 的 参数 清单 。 

我 只 能 记 住 ~p、~s 和 ~n。 如 果 你 从 它们 开始 ， 就 不 会 遇 到 太 多 问题 。 

悄悄 话 

我 说 方 了 。 你 需要 的 很 可 能 不 止 -p、~s 和 ~n。 这 里 有 一 些 例子 : 
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Format Result 

ijo:format("|~1l0s}|",["abc"]) | abc| 
io:format{("|~-10s|",{"abc"])} labc | 
io:format("|~10.3.+s|",["abc"]) | +++++++abcC | 
jo:format("|~-10.10.+s|",["abc"]) |abpc+++++++| 
jo:format("|~10.7.+s|",["abc"]) |+++abc++++ | 


16.3.2 ”把 各 行 写 入 文件 
下 面 这 些 命令 和 之 前 的 例子 很 像 ， 我 们 只 是 使 用 了 不 同 的 格式 命令 。 


1> {ok, S} = file:open("test2.dat", write). 
{ok ,<0 .62.0>} 

2> lio:format(S, "~s~n", ["Hello readers"]). 
ok 

3> lio:format(S, "~w~n", [123]). 

ok 

4> i0o:format(S$, "~s~n", ["that's it"]). 

ok 

5> file:close(S). 

ok 


这 样 就 创建 出 了 一 个 名 为 test2.dat 的 文件 ， 它 的 内 容 如 下 : 


Hello readers 
123 
that's it 





16.3.3 一 次 性 写 入 整个 文件 


这 是 最 高 效 的 写 入 文件 方式 。 file:write file(File, 10) 会 把 I0 里 的 数据 (一 个 WO 列表 ) 
写 人 File。( 1O 列 表 是 一 个 元 素 为 1/O 列 表 、 二 进 制 型 或 0 到 255 整 数 的 列表 。1/O 列 表 在 输出 时 会 
锌 目 动 “局 平 化 "， 意 思 是 所 有 的 列表 括号 都 会 被 移 除 。) 这 种 方式 极其 高 效 ， 也 是 我 经 常用 的 。 
下 一 节 里 的 程序 对 此 做 了 演示 。 

列 出 文件 里 的 URL 

编写 一 个 名 为 urLs2htmLFiLe(L， 数 , 它 会 接受 一 个 URL 列 表 L 并 生成 HTML 
文件 ， 里 面 的 URL 都 显示 为 可 点 击 链接 。 这 样 就 可 以 采用 单 次 IO 操作 写 人 整个 文件 的 技巧 。 我 
们 将 在 scavenge_urtLs 模 块 里 编写 程序 。 首 先是 程序 的 头 部 信息 : 


























scavenge_urls.erl 


-module(scavenge urls). 
-export( [urls2htmlFile/2, bin2urls/1]). 
-import(lists, [reverse/l1, reverse/2, map/21). 


这 个 程序 有 两 个 人 口 点 。urls2htmlFile (Urls，File) 接 受 一 个 URL 列 表 并 创建 HTML 文 
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件 , 在 文件 里 为 每 个 URL 各 创建 一 个 可 点 击 的 链接 。bin2urls (Bin) 裔 历 一 个 二 进 制 型 ,然后 返 
回 一 个 包含 该 二 进 制 型 内 所 有 URL 的 列表 。urls2htmtlFile 的 代码 如 下 : 


scavenge_urls.erl 


urls2htmlFile(Urls, File) -> 
file:write file(File, urls2html (Urls)). 


bin2urls(Bin) -> gather urls(binary to list(Bin), []). 
urls2html (Urls) -> [hl("vUris"),make list(Urls)]. 
hl(Title) -> ["<hi>", Title, "</hi>\n"]. 


make list(L) -> 
["<ul>\n", 
map(fun(I) -> ["<ti>",I,"</Lli>\n"] end, L), 
"</ul>1n"]. 
这 段 代 码 返 回 一 个 由 字符 组 成 的 VO 列表 。 请 注意 我 们 没有 尝试 局 平 化 这 个 列表 〈 这么 做 效 
京 很 低 )。 我 们 生成 一 个 由 字符 组 成 的 深层 列表 ， 然 后 把 它 特 接 扔 给 输出 方法 。 用 
fiLe:write fite 把 这 个 IO 列表 写 和 文件 时 ，LO 系 统 会 自动 扁平 化 列表 (也 就 是 说 ， 它 只 会 输 
出 列表 里 的 字符 ， 忽 略 列 表 括 号 )。 最 后 ， 从 二 进 制 型 里 提取 URL 的 代码 如 下 : 











scavenge_urls.erl 


gather urls("<a href ++ T, L) -> 
{Url, Tl} = collect url body(T, reverse("<a href")), 
gather_ urls(T1, [Urt|L]); 
gather UrlLs([ |T]，L) -> 
gather _ urls(T, L); 
gather urls([], L) -> 
Es 


collect url body("</a>" ++ T, L) -> {reverse(L, "</a>"), T}; 

collect url body([H|T], L) -> Collect uyrl body(T, [HI|L]); 

collect uyrl body([], _) -> {[],[]}. 

要 运行 它 ， 需要 有 一 些 数据 来 解析 。 输 入 数据 (一 个 二 进 制 型 ) 是 HTML 网 页 的 内 容 ， 所 以 
需要 找 一 张 HTML 网 页 来 操作 。 我 们 将 通过 socket examples:nano get url (参见 17.1.1 节 ) 
来 实现 。 

我 们 将 在 shell 里 分 几 步 完成 它 。 

1> B = socket examples:nano get url("www.erlang.org"), 

L = scavenge urls:bin2urls(B), 


scavenge urls:urls2htmlFile(L, "gathered.html"). 
ok 


这 样 就 生成 了 gathered.html 文 件 。 
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gathered.html 


<hl>Urls</h1> 
<UL> 
<li><a href="oiqd news.htmi">0lder news..... </a></1li> 
<li><a href="http:;//www.erlang-consulting.com/training fs.html">here</a></\i> 
<li><a href="project/megaco/">Megaco home</a></Li> 
<1li><a href="EPLICENSE">Erlang Public License (EPL)</a></1i> 
<1li><a href="user,.html#smtp client-1,0">smtp client-1.0</a></1i> 
<li><a href="download-stats/">download statistics graphs</a></li> 
<LL><a href="project/test server">Erlang/OTP Test 
Server</a></LI> 
<Li><a href="http://www.erlang.se/euc/06/">proceedings</a></\i> 
<li><a href="/doc/doc-5.5.2/doc/highlights.html"> 
Read more in the release highlights. 

</a></1i> 
<LI><a href="index.htmtl"><1img src="images/erlang.gif" 

border="0" alt="Home"></a></1i> 
</ul> 





16.3.4 与 入 随机 访问 文件 


在 随机 访问 模式 下 写 和 人 某 个 文件 和 该 取 它 很 相似 。 首 先 ， 必 须 用 write 模式 打开 这 个 文件 。 
接 下 来 ， 用 file:pwrite(IoDev，Position，Bin) 写 入 文件 。 


这 里 有 一 个 例子 : 

1> {ok, S$S} = file:open("some filename here", [raw,write,binary]). 
{ok, ...} 

2> file:pwrite(S, 10, <<"nNew">>). 

ok 

3> file:close(S). 

ok 











它 从 文件 内 仿 移 量 为 10 的 位 置 开 始 写 入 字符 串 new， 和 窗 益 了 原 有 内 容 。 


16.4 ”目录 和 文件 操作 


file 里 有 三 个 操作 目录 的 函数 。1list dir(Dir) 用 来 生成 一 个 Dir 里 的 文件 列表 ， 
make_dir(Dir) 创 建 一 个 新 目录 ，del_dir(Dir) 删 除 一 个 目录 。 
如 果 在 本 书 所 用 的 代码 目录 里 运行 List_ dir， 就 会 见 到 类 似 下 面 这 样 的 输出 : 


1> cd("/home/joe/book/erlang/Book/code"). 
/home/joe/book/erlang/Book/code 

ok 

2> file:list dir("."). 

{ok, ["1id3 vil.erl~", 
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"update binary file.beam", 
"benchmark assoc.beam", 
"id3 vl.erl", 

"scavenge urls.beam", 
"benchmark mk assoc.beam", 
"benchmark mk assoc.erl", 
"1id3 v1.beam", 

"assoc bench.beam", 

"Llib misc.beam", 
"benchmark assoc.erl", 
“Update binary file.erl", 
"foo.dets", 

"big.tmp", 





请 注意 , 这 里 列 出 的 文件 没有 特定 的 顺序 , 不 会 告诉 你 它们 是 文件 还 是 目录 , 也 没有 文件 大 
小 等 信息 。 

要 了 解 目录 列表 里 各 个 文件 的 更 多 信息 ， 我 们 会 使 用 fite: read_file info， 这 正 是 下 一 
方 的 主题 。 


16.4.1 查找 文件 信息 


要 查找 文件 F 的 信息 , 我 们 会 调用 file:read file info(F)。 如果 F 是 一 个 合法 的 文件 或 目 
录 名 ， 它 就 会 返回 {ok，Info}。Info 是 一 个 #file info 类 型 的 记录 ， 此 类 型 的 定义 如 下 : 


-record(file info, 





{size, % Size of file In bytes. 
type, % Atom: device, directory, regular, 

% or other. 
access, % Atom: read, write, read write, or none. 
atime, % The local time the file was last read: 

% {ff{Year, Mon, Day}, {Hour, Min, Sec}}. 
mtime, % The Local time the file was last written. 
ctime, % The interpretation of this time field 

% IS dependent on operating systenm. 

% On Unix it is the last time the file or 

% or the inode was changed, On Windows, 

% It 1s the creation time., 
mode, % TInteger: File permissions. On Windows, 

% the owner permissions WILL pe duplicated 

% for group and user. 
links, % Number of links to the file (1 IFr the 

% filesystem doesn't support links). 

}). 


注意 mode 和 access 字 段 有 重合 ,可 以 用 mode 一 次 性 设置 多 个 文件 的 属性 ,也 可 以 用 更 简单 的 
acceSsSs 操 作 。 
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要 查找 某 个 文件 的 大 小 和 类 型 ， 就 会 调用 read file info， 就 像 下 面 这 个 例子 (请 注意 ， 
我 们 必须 包含 file.hrl， 因 为 它 内 含 #file info 记 录 的 定义 ): 





lib_misc.erl 


-include lib("kernel/include/file.hrl")., 
file size and type(File) -> 
case file:read file info(File) of 
{ok, Facts} -> 
{Facts#file info.type, Facts#file info.size}; 
-> 
error 


end. 


现在 可 以 增强 List file 返 回 的 目录 清单 了 , 方法 是 在 1Ls ( ) 晒 数 里 添加 文件 信息 , 就 像 下 面 
这 样 : 





lib_misc.erl 
Ls(Dir) -> 
{ok, L} = file:list dir(Dir), 
Lists:map(fun(I) -> {1I, file size and type(I)} end, lists:sort(L)). 


现在 ， 当 我 们 列 出 文件 时 ， 它 们 会 按 顺 序 排列 并 包含 额外 的 有 用 信息 。 


1> lib misc:ls("."). 
[{"Makefile",{regular,1244}}, 
{"README" , {regular,1583}}, 
{"abc.erl",{regular,105}}, 
{"'alloc test.erl",{regular,303}}, 





{"socket dist",{directory,4096}}, 


为 了 方便 起 见 ，filelib 模 块 导出 了 一 些小 方法 ， 比 如 file size(File) 和 is dir(X)。 它 
们 只 不 过 是 file:read file info 的 接口 。 如 果 只 想 获 得 文件 大 小 ， 更 方便 的 做 法 是 调用 
filelib:file size， 而 不 是 调用 file:read file info 然 后 解 包 #file info 记 录 里 的 元 素 。 


16.4.2 ”复制 和 删除 文件 


file:copy(Source，Destination) 会 把 文件 Source 复 制 到 Destination 里 。 
fiLe:deLete(FiLe) 会 删除 FiLe。 


16.5 ”其 他 信息 


到 目前 为 止 , 我 们 已 经 介绍 了 我 日 第 用 来 操作 文件 的 大 多 数 函 数 。 我 们 不 打算 对 下 列 主题 进 
行 深 入 讨论 ， 你 可 以 在 手册 页 里 找到 更 多 细 市 。 
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@ 文件 模式 
用 file:open 打 开 文 件 时 , 我 们 会 以 某 个 或 某 一 组 模式 来 打开 它 。 事 实 上 , 模式 的 数量 比 
我 们 想象 的 要 多 得 多 。 举 个 例子 ， 旋 取 和 写 人 gzip 压 缩 文件 时 可 以 使 用 comp ressed 这 个 
模式 标记 。 手册 页 里 有 完 整 的 清单 。 

@ 修改 时 间 、 用 户 组 、 符 号 链接 
可 以 用 file 里 的 一 些 方 法 来 设置 它们 。 

@ 错误 代码 
我 曾经 泛泛 地 说 过 所 有 错误 都 是 {ferror，Why} 这 种 形式 。 事 实 上 ，Why 是 一 个 原子 ( 比 
如 用 enoent 表 示 文 件 不 存在 ， 等 等 )。 错误 代 公 的 数量 其 实 有 很 多 , 手册 页 里 对 它们 都 进 
行 了 描述 。 

© filename 
filename 模 块 里 有 一 些 很 有 用 的 方法 ， 比 如 拆 分 目录 里 的 完整 文件 名 来 获得 文件 扩展 名 ， 
以 及 用 各 个 组 成 部 分 重建 文件 名 ， 等 等 。 所 有 这 些 都 是 以 路 平台 的 方式 实现 的 。 

@ filelib 
filelib 模 块 有 一 些小 方法 能 给 我 们 减少 一 点 工作 量 。 举 个 例子 ，filelib:ensure_ 
dir(Name) 会 确保 给 定 文 件 或 目录 名 Name 的 所 有 上 级 目录 都 存在 ， 必 要 的 话 会 尝试 创建 
ey i 


16.6 一 个 查找 工具 函数 


在 最 后 一 个 例子 里 ， 我 们 将 用 file:1list dir 和 file:read file info 来 编写 一 个 通用 型 
“查找 ”工具 。 
这 个 模块 的 主要 入 口 点 如 下 : 


Lib find:files(Dir, RegExp, Recursive, Fun, AccO) 


里 面 的 参数 如 下 。 

@ DIr 
这 个 目录 名 是 文件 搜索 的 起 点 。 

@ RegExp 
这 是 一 个 shell 风 格 的 正则 表达 式 , 用 于 测试 我 们 找到 的 文件 。 如 采 遇 到 的 文件 匹配 这 个 正 
则 表达 式 ， 就 会 调用 Fun (File，Acc)， 其 中 File 是 匹配 正则 表达 式 的 文件 名 。 

@ Recursive = true | false 
这 个 标记 决定 了 搜索 是 否 应 该 层 层 深入 当前 搜索 目录 的 子 目 录 。 

@ Fun(File, AccIn) -> AccOut 
如 果 regExp 罗 配 File， 这 个 函数 就 会 被 应 用 到 File 上。Acc 是 一 个 初始 值 为 Acc0 的 归 集 
般 。Fun 在 每 次 调用 后 必须 返回 一 个 新 的 归 集 值 ， 这 个 值 会 在 下 次 调用 Fun 时 传递 给 它 。 
归 集 器 的 最 终 值 就 是 Lib find:files/5 的 返回 值 。 
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可 以 向 Lib _find:files/5 传 递 任 何 我 们 喜欢 的 函数 。 举 个 例子 ， 可 以 用 下 面 这 个 函数 创建 
一 个 文件 列表 ， 并 给 它 传递 一 个 空 列 表 作 为 初始 值 : 

fun(File, Acc) -> [File|lAcc] end 

模块 入 口 点 Lib find:files(Dir，ShellRegExp，Flag) 为 此 程序 的 最 常用 功能 提供 了 一 
个 简化 的 入 口 点 。 这 里 的 ShellRegExp 是 一 个 shell 风 格 的 通配符 模式 ， 比 完整 形式 的 正则 表达 式 
更 容易 编写 。 

作为 这 种 简化 调用 形式 的 一 个 例子 ， 下 面 的 调用 : 

lib find:files(Dir, "*.ertl", true) 

会 逐 层 查找 Dir 目 录 下 的 所 有 Erlang 文 件 。 如 果 最 后 那个 参数 是 faLse， 就 只 会 查找 Dir 目 录 
里 的 Erlang 文 件 ， 而 不 会 深入 子 目录 。 

最 后 是 代码 : 





























lib_ find.erl 

-moduLetLib find). 
-export([files/3, files/5]). 
-import(lists, [reverse/1]). 


-include lib("kernel/include/file.hrl")., 


files(Dir, Re, Flag) -> 
Rel = xmerl regexp:sh to awk (Re), 
reverse(files(Dir, Rel, Flag, fun(File, Acc) ->[File|lAcc] end, [])). 


files(Dir, Reg, Recursive, Fun, Acc) -> 
case file:list dir(Dir) of 
{ok, Files} -> find files(Files, Dir, Reg, Recursive, Fun, Acc); 
{error, } -> Acc 
end. 


find files([File|T], Dir, Reg, Recursive, Fun, AccO) -> 
FullName = filename:]join( [Dir,File]), 
case file type(FullName) of 


regular -> 
case re:run(FullName, Reg, [{capture,none}]) of 
match -> 


Acc = Fun(FullName, AccO), 
find files(T, Dir, Reg, Recursive, Fun, Acc), 
nomatch -> 
find files(T, Dir, Reg, Recursive, Fun, AccO) 
end; 
directory -> 
case Recursive of 
true -> 
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Accl = files(FullName, Reg, Recursive, Fun, AccO), 

find files(T, Dir, Reg, Recursive, Fun, Acc1); 
false -> 

find files(T, Dir, Reg, Recursive, Fun, AccO) 


end; 
error -> 
find files(T, Dir, Reg, Recursive, Fun, AccO) 
end; 
find files([], , _,_,_, A) -> 
A: 


file type(File) -> 
case file:read file info(File) of 
{ok, Facts} -> 
case Facts#file info.type of 


regular -> regular.,; 
directory -> directory; 
-> 全 PPO 
end; 
-> 
error 


end. 

这 就 是 查找 文件 的 方法 。 你 可 能 注意 到 这 个 程序 都 是 顺序 的 。 要 加 速 它 ,可 以 用 多 个 并 行进 
程 来 实现 并 行 处 理 。 我 不 会 在 这 里 做 这 件 事 ， 你 可 以 思考 一 下 怎么 做 。 

把 Erlang 里 的 文件 访问 和 并 发 结合 在 一 起 ， 我 们 就 有 了 一 个 解决 复杂 问题 的 强力 工具 。 如 果 
想 要 并 行 分 析 大 量 的 文件 ， 就 可 以 分 裂 出 许多 进程 ， 让 它们 各 目 分 析 一 个 文件 。 我 们 唯一 需要 注 
意 的 问题 就 是 必须 确保 两 个 进程 不 会 同时 读 取 和 写 入 同一 个 文件 。 

实现 高 效 文 件 操作 的 方法 是 在 一 次 操作 里 进行 文件 的 读 取 和 写 入 ， 并 在 写 入 文件 前 先 创建 
IO 列表 。 











16.7 练习 


(1) 编译 Erlang 文 件 Xx.ertL 后 会 生成 一 个 X,beam 文 件 (如 果 编 译 成 功 的 话 )。 编写 一 个 程序 来 
检查 某 个 Erlang 模 块 是 否 需要 重新 编 详 。 做 法 是 比较 相关 Erlang 文 件 和 beam 文 件 的 最 后 修改 时 间 
鹤 。 

(2) 编写 一 个 程序 来 计算 某 个 小 文件 的 MD5 校 验 和 , 做 法 是 用 内 置 函 数 erlang :md5/1 来 计算 
文件 数据 的 MD5 校 验 和 (有关 这 个 内 置 函数 的 详情 请 参阅 Erlang 于 册页 )。 

(3) 对 一 个 大 文件 ( 比如 儿 百 MB ) 重复 前 面 的 练习 。 这 次 分 小 块 谈 取 该 文件 ， 并 用 
erlang:md5 init、erlang:md5 update 和 和 erlang:md5 final 计 算 该 文件 的 MD5 校 验 和 。 

(4) 用 tib_find 模 块 查找 计算 机 里 的 所 有 .jpg 文件 。 计算 每 一 个 文件 的 MD5 校 验 和 , 然后 比 
较 校 验 和 来 看 看 是 否 存 在 两 张 相 同 的 图 片 。 

(5) 编写 一 种 缕 存 机 制 ， 让 它 计算 文件 的 MD5 校 验 和 ， 然 后 把 结果 和 文件 的 最 后 修改 时 间 一 
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起 保存 在 缓存 里 。 当 想 贾 某 个 文件 的 MD5 值 时 就 检查 缓存 ,看 看 是 否 已 经 计算 过 ， 如 有 果 文 件 的 最 
后 修改 时 间 有 变化 就 重新 计算 它 。 

(6) 一 条 推 特 刚 好 是 140 字 节 长 。 编 写 一 个 名 为 twit store,ert 的 随机 访问 式 推 特 存储 模 块 ， 
并 导出 下 列 函 数 : init(K) 分 配 K 条 推 特 的 空间 。store(N，Buf) 在 存储 区 里 保存 第 N ( 范围 是 1 
至 K ) 条 推 特 的 数据 Buf (一 个 140 字 市 的 二 进 制 型 )。fetch(N) 取 出 第 N 条 推 特 的 数据 。 








套 接 字 编 程 














我 编写 过 的 大 多 数 有 趣 的 程序 都 直接 或 间接 涉及 僚 接 字 ( socket )。 套 接 字 编程 很 有 乐趣 ， 
为 它 能 让 应 用 程序 与 互联 网 上 的 其 他 机 妖 交 互 ， 这 比 只 进行 本 地 操作 有 更 大 的 空间 。 

套 接 字 是 一 种 通信 信道 ， 让 不 同 的 机 需 能 用 互联 网 协议 〈Internet Protocol， 简 称 IP ) 在 网 上 
通信 ,在 这 一 章 里 ,我 们 将 把 重点 放 在 两 个 核心 互联 网 协议 上 :传输 控制 协议 ( Transmission Control 
Protocol， 人 简称 TCP ) 和 用 户 数 据 报 协议 ( User Datagram Protocol， 人 简称 UDP )。 

UDP 能 让 应 用 程序 相互 发 送 简短 的 消息 ( 称 为 数据 报 ), 但 是 并 不 保证 这 些 消息 能 成 功 到 达 。 
它们 也 可 能 会 不 按照 发 送 顺 序 到 达 。 而 TCP 能 提供 可 徘 的 学 市 流 , 只 要 连接 存在 就 会 按 顺 序 到 达 。 
用 TCP 发 送 数 据 的 额外 开销 比 用 UDP 发 送 数 据 更 大 。 可 以 选择 可 徘 但 更 慢 的 信道 (TCP ), 也 可 以 
选择 更 快 但 不 可 徘 的 信道 ( UDP )。 

套 接 字 编程 有 两 个 主要 的 库 : gen tcp 用 于 编写 TCP 应 用 程序 ，gen _ udp 用 于 编写 UDP 应 用 
程序 。 

本 草 将 审 我 们 了 解 如 何 用 TCP 和 UDP 套 接 字 来 编写 客户 端 与 服务 天 。 我 们 将 讨论 各 种 不 同 的 
服务 融 形 式 〈 并 行 式 、 顺 序 式 、 阻 塞 式 和 非 阻塞 式 )， 并 看 看 如 何 编写 流量 整形 〈traffic-shaping ) 
应 用 程序 来 控制 进入 程序 的 数据 流 。 












































17.1 使 用 TCP 


我 们 将 以 一 个 简单 的 TCP 程 序 作为 这 场 套 接 字 编 程 历险 的 起 点 , 它 将 从 东 个 服务 角 上 获取 信 
上 县。 在 此 之 后 , 将 编写 一 个 简单 的 顺序 TCP 服 务 人 各 ,并 展示 如 何 让 它 并 行 化 来 处 理 多 个 并 行 会 话 。 


17.1.1 从 服务 器 获取 数据 


首先 ， 编 写 一 个 名 为 nano_get_ur1/0 的 小 函数 ， 它 用 一 个 TCP 套 接 字 来 从 http://www. 
googLe. com 获 取 一 张 HITML 了 网 页 。 














socket examples.er| 


nano get url() -> 
nano get url('"www.googte,com"). 


nano _ get url(Host) -> 
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{ok,Socket} = gen tcp:connect(Host,80, [binary, {packet, 0}]), 
ok = gen tcp:send(Socket, "GET / HTTP/1.0\r\in\r\n"), 
receive data(Socket, [1]). 


® | 


receive data(Socket, SoFar) -> 


receive 
3 {tcp,Socket,Bin} -> 
receive data(Socket, [Bin|SoFarl]); 
@ {tcp closed,Socket} -> 
5) List to binary(reverse(SoFar)) 
end. 
它 的 工作 方式 如 下 。 


@ 调用 gen tcp:connect 来 打开 一 个 到 http://www.google.com80 端 口 的 TCP 套 接 字 。 连 
接 调 用 里 的 binary 参 数 告 诉 系 统 要 以 “二 进 制 ” 模 式 打 开 套 接 字 ， 并 把 所 有 数据 用 二 进 制 型 传 
给 应 用 程序 。{packet,0} 的 意思 是 把 未 经 修改 的 TCP 数 据 特 接 传 给 应 用 程序 。 

从 调用 gen tcp:send， 把 消息 GET / HTTP/1.0\r\n\r\n 发 送 给 套 接 字 ， 然 后 等 待 回复 。 
这 个 回复 并 不 是 放 在 一 个 数据 包 里 ,而 是 分 成 多 个 片段 , 一 次 发 送 一 点 。 这 些 厂 段 会 被 接收 成 为 
消息 序列 ， 发 送 给 打开 《或 控制 ) 套 接 字 的 进程 。 

全 收 到 一 个 {tcp,Socket,Bin} 消 息 。 这 个 元 组 的 第 三 个 参数 是 一 个 二 进 制 型 ， 原 因 是 打开 
套 接 字 时 使 用 了 二 进 制 模式 。 这 个 消息 是 Web 服 务 硕 发 送 给 我 们 的 数据 片段 之 一 。 把 它 添加 到 目 
前 已 收 到 的 片段 列表 中 ， 然 后 等 待 下 一 个 片段 。 

四 收 到 一 个 {tcp_ctosed，Socket} 消 息 。 这 会 在 服务 需 完 成 数据 发 送 时 发 后 。 

@ 当 所 有 片段 都 到 达 后 ， 因 为 它们 的 保存 顺序 是 错误 的 ， 所 以 反 转 它们 并 连接 所 有 片段 。 

重新 组 朔 片 段 的 代码 是 这 样 的 : 

receive data(Socket, SoFar) -> 

receive 
{tcp,Socket,Bin} -> 
receive data(Socket, [Bin|SoFar]); 


{tcp closed,Socket} -> 
list to binary(reverse(SoFar)) 



































end. 


这 样 ， 随 痢 瞩 段 陆续 抵达 ， 要 做 的 就 是 把 它们 座 加 到 SoFar 的 列表 头 。 当 所 有 片段 都 已 到 达 
并 且 爸 接 字 关闭 后 ， 反 转 这 个 列表 并 连接 所 有 片段 。 
你 可 能 会 认为 更 好 的 做 法 是 像 这 样 编写 代码 来 归 集 片段 : 


recelve data(Socket, SoFar) -> 
receive 
{tcp,Socket,Bin} -> 
receive data(Socket，List to binary({SoFar,Bin])); 
{tcp closed,Socket} -> 
SoFar 





end. 
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这 段 代 人 码 并 没有 错 , 但 是 比 原先 的 版 本 效率 更 低 。 原因 是 我 们 在 后 一 个 版 本 里 持续 将 一 个 新 
的 二 进 制 型 梁 加 到 缓冲 区 末尾 ,而 这 需要 进行 大 量 的 数据 复制 。 更 好 的 方法 是 把 所 有 搬 段 归 集 到 
一 个 列表 里 〈 会 是 错误 的 顺序 )， 然 后 反 转 整个 列表 ， 在 单 次 操作 里 连接 所 有 瞩 段 。 

来 测试 一 下 这 个 小 型 HTTP 客户 端 能 不 能 

1> B = socket examples:nano get url(). 


<<"HTTP/1.0 302 Found\r\nLocation: http://www.google.se/\r\n 
Cache-Control:; private\r\nSet-Cookie: PREF=ID=b57a2c:TM",..,>> 














注意 ”运行 hano get url 时 ， 结 果 会 是 一 个 二 进 制 型 ， 这 样 你 就 能 看 到 二 进 制 型 在 Erlang shell 
里 美化 打印 后 是 什么 样子 的 。 当 你 美化 打印 二 进 制 型 时 ， 所 有 的 控制 字符 都 会 显示 成 转 
义 格 式 。 而 且 这 个 二 进 制 型 是 被 截断 的 , 输出 内 容 后 面 的 省 略 号 (,. .>> ) 表 明了 这 一 点 。 
如 果 想 查看 整个 二 进 制 型 ， 可 以 用 io:format 打 印 它 ， 或 者 用 string:tokens 把 它 分 成 


几 部 分 。 


编写 一 个 Web 服 务 器 

编写 Web 客 户 端 或 服务 器 这 样 的 程序 是 非常 有 乐趣 的 。 是 的 ,其 他 人 已 经 编写 过 这 些 程序 ， 
但 如 果真 想 知 道 它 们 是 如 何 工作 的 ,就 可 以 深入 本 质 来 了 解 它 们 的 工作 方式 。 谁 知道 呢 ， 也 许 
我 们 的 Web 服 务 器 会 比 现 有 的 更 出 色 。 

要 创建 一 个 Web 服 务 器 或 者 其 他 任何 实现 标准 互联 网 协议 的 软件 ， 需 要 使 用 正确 的 工具 ， 
并 且 要 确切 知道 该 实现 哪 种 协议 。 

在 获取 网 页 的 示例 代码 里 ， 打 开 80 端 口 并 发 给 它 一 个 GET / HTTP/1.0\r\n\r\n 命 令 。 使 
用 RFC 1945 里 定义 的 HTTP 协议 。 互 联网 服务 的 所 有 主要 协议 都 在 各 自 的 征求 评议 文件 
( Requests for Comments， 简 称 RFC ) 里 进行 定义 。 所 有 REFC 的 官方 网 站 是 http:/www.ietforg ( 互 
联网 工程 任务 组 的 主页 )。 

另 一 个 宝贵 的 信息 来 源 是 包 噢 探 器 (packet sniffer )。 有 了 包 噢 探 器 ， 就 可 以 捕捉 并 分 析 所 
有 进出 应 用 程序 的 耻 数 据 包 。 大 多 数 包 嗅 探 器 都 包含 能 解码 并 分 析 包 内 数据 的 软件 , 还 能 以 有 
意义 的 方式 呈现 数据 。Wireshark ( 以 前 叫 Ethereal ) 是 其 中 最 知名 也 可 能 是 最 好 的 ， 下 载 地 址 
是 http://www.wireshark.org 

有 了 包 嗅 探 器 的 转 储 信息 和 合适 的 RFC 作 武器 ， 就 可 以 着 手 编写 下 一 个 杀手 级 应 用 程 
J 


2> i0o:format("~p~n",[B]). 
<<"HTTP/1.0 302 Found\r\nLocation: http://www.google.se/\r\n 
Cache-Control: private\r\nSet-Cookie: PREF=1D=b57a2c:TM'" 
TM=]76575171639526:LM=1]175441639526:S=gkfTrK6AFkybT3; 
explires=9un，17-Jan-2038 19:14:07 
. Several lines omitted ... 
> 
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3> string:tokens(binary to list(B),"\r\n"). 
["HTTP/1.0 302 Found", 
"Location: http://ww.google.se/", 
"Cache-Control: private", 
"Set-Cookie: PREF=ID=ec7f0Oc7234b852dece4:TM=]11713424639526} 
LM=1171234639526:S=gsdertTrK6AEybT3; 
expbires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com", 
"Content-Type: text/yhtml", 
"Server: GWS/2.1", 
"Content-Length: 218", 
"Date: Fri, 16 Jan 2009 15:25:26 GMT", 
"Connection: Keep-Alive", 
, lines omitted ... 


请 注意 ， 响 应 码 302 不 是 错误 ， 它 是 预期 的 命令 响应 ， 意 思 是 重 定 疝 到 一 个 新 地 址 。 为 外 请 
注意 这 个 例子 展示 了 僚 接 子 通 信 的 工作 方式 ， 而 且 没 有 严格 避 循 HTTP 协 议 。 

这 或 多 或 少 是 一 个 Web 客 户 问 的 工作 方式 (重点 在 少 上 ， 因 为 我 们 要 做 很 多 工作 才能 在 Web 
浏 哆 从 里 正确 演 染 出 结 采 数据 ) 但 是 ， 之 前 的 代码 是 你 目 己 进行 试验 的 一 个 展 好 起 点 。 你 可 能 
会 想 试 着 修改 代码 来 获取 和 你 存 整个 网 站 ， 或 者 目 动 去 谈 取 电 子 邮 件 。 可 能 性 是 无 穷 的 。 























17.1.2 一 个 简单 的 TCP 服 务 器 


我 们 在 上 一 节 里 编写 了 一 个 简单 的 客户 端 。 现 在 来 编写 一 个 服务 套 。 

这 个 服务 硕 会 打开 2345 闪 口 , 然后 等 竺 一 个 消息 。 这 个 消息 是 一 个 二 进 制 型 , 内 含 一 个 Erlang 
数据 类 型 。 这 个 数据 类 型 是 一 个 Erlang 字 符 串 ， 内 含 一 个 表达 式 。 服 务 融 会 执行 这 个 表达 式 ， 然 
后 把 结果 发 给 客户 问 ， 方 法 是 把 结果 写 入 套 接 字 。 

要 编写 这 个 程序 ( 以 及 任何 运行 在 TCP/IP 上 的 程序 )， 必 须 回答 一 些 简单 的 问题 。 

口 数据 是 如 何 组 织 的 ”如 何 知 道 单 次 请 求 或 啊 应 包含 多 少数 据 ? 

口 请 求 或 啊 应 里 的 数据 是 如 何 编码 和 解码 的 ? ( 编码 数据 有 时 被 称 为 marshaling， 即 编组 。 

解码 数据 有 时 被 称 为 demarshaling， 即 解 编 。) 

TCP 符 接 字 数据 只 不 过 是 一 个 无 差别 的 字 节 流 。 这 些 数 据 在 传输 过 程 中 可 以 被 打 散 成 任意 大 
小 的 片段 ， 所 以 需要 事先 约定 ， 这 样 才能 知道 多 少数 据 代表 一 个 请 求 或 响应 。 

我 们 在 Erlang 里 使 用 了 一 种 简单 的 约定 , 即 每 个 逻辑 请 求 或 啊 应 前 面 都 会 有 一 个 N( 1、2 或 4 ) 
字 节 的 长 度 计数 。 这 就 是 gen tcp:connect 和 gen tcp:Listen 函 数 里 参数 {packet，N} 的 意思 。 
packet 这 个 词 在 这 里 指 的 是 应 用 程序 请 求 或 啊 应 消息 的 长 度 ， 而 不 是 网 络 上 的 实际 数据 包 。 需 要 
注意 的 是 ， 客 户 端 和 服务 需 使 用 的 packet 参 数 必须 一 致 。 如 果 局 动 服务 磊 时 用 了 {packet,2}， 
客户 问 用 了 {packet,4}， 程 序 就 会 失败 。 

用 {packet,N} 选 项 打开 一 个 套 接 字 后 ， 无 需 担 心 数据 人 碎片 的 问题 。Erlang 驱 动 会 确保 所 有 
碎片 化 的 数据 消息 首先 被 重组 成 正确 的 长 度 ， 然 后 才 会 传 给 应 用 程序 。 

下 一 个 要 关心 的 问题 是 数据 编码 和 解码 。 我 们 将 用 最 侧 单 的 方式 来 编码 和 解码 消息 , 也 就 是 
用 term to_binary 编 但 Erlang 数 据 类 型 ， 然 后 用 它 的 逆 函 数 binary_to_term 解 但 数据 。 
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请 注意 , 客户 端 与 服务 髓 通信 所 需 的 打包 约定 和 编码 规则 是 由 两 行 代码 实现 的 , 第 一 行 是 在 
打开 套 接 字 时 使 用 {packet ,4} 选 项 , 第 二 行 是 用 term to_binary 和 它 的 送 函 数 来 编码 与 解码 数 
据 。 








相 比 HTTP 或 XML 这 些 基 于 文本 的 方法 ， 打 包 和 编码 Erlang 数 据 的 便利 性 给 了 我 们 很 大 的 优 
拖 。 使 用 Erlang 内 置 晒 数 term_to_binary 和 它 的 逆 困 数 binary_ to_term 通 稼 会 比 用 XML 数据 的 
同类 操作 快 不 止 一 个 数量 级 ， 而 且 发 送 的 数据 也 会 少 很 多 。 现 在 来 看 程序 。 首 先 ， 这 里 有 一 个 非 
帝 价 单 的 服务 大: 





socket_examples.erl 


start nano server() -> 
全 {ok, Listen} = gen tcp:listen(2345, [binary, {packet, 4}, 
{reuseaddr, true}, 
{active, true}]), 
各 {ok, Socket} = gen tcp:accept(Listen) ， 
3) gen tcp:close(Listen), 
loop(Socket). 
loop(Socket) -> 
receive 
{tcp, Socket, Bin} -> 
io:format("Server received binary = ~p~n", [Bin]), 
@ Str = binary to term(Bin), 
io:format("Server (unpacked) ~p~n",[Str]), 
Reply = Lib misc:string2value(Str), 
io:format("Server replying = ~p~n",[Reply]), 
人 gen tcp:send(Socket, term to binary (Reply)), 
loop(Socket), 
{tcp closed, Socket} -> 
io:format("Server socket closed~n") 


3 


end. 


它 的 工作 方式 如 下 。 

@ 首先 , 调用 gen tcp:Listen 来 监听 2345 端 口 的 连接 , 并 设置 消息 的 打包 约定 。{packet， 
4} 的 意思 是 每 个 应 用 程序 消息 前 部 都 有 一 个 4 字 节 的 长 度 包 头 。 然 后 gen_ tcp:listen(..) 会 返 
回 {ok，Listen} 或 {ferror，Why}， 但 我 们 只 关心 能 够 打开 套 接 字 的 返回 值 。 因 此 ， 编 写 如 下 代 
码 : 














{ok, Listen} = gen tcp:listent...), 


这 会 让 程序 在 gen tcp:listen 返 回 {error，...} 时 抛 出 一 个 模式 匹配 异常 错误 。 在 成 功 
的 情况 下 ， 这 个 场 句 会 绑 定 Listen 到 刚 监听 的 套 接 字 上 。 我 们 只 能 对 监听 端口 做 一 件 事 ， 那 就 
是 把 它 用 作 gen tcp:accept 的 参数 。 

外 现在 调用 gen_ tcp:accept(Listen)。 在 这 个 阶段 ， 程 序 会 挂 起 并 等 待 一 个 连接 。 当 我 
们 收 到 连接 时 ， 这 个 函数 就 会 返回 变量 Socket， 它 绑 定 了 可 以 与 连接 客户 端 通信 的 套 接 字 。 

全 在 accept 返 回 后 立即 调用 gen_tcp:ctLose(Listen)。 这 样 就 关 财 了 监听 套 接 字 , 使 服务 
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众 不 再 接收 任何 新 连接 。 这 么 做 不 会 影响 现 有 连接 ， 只 会 阻止 新 连接 。 

@ 解码 输入 数据 ( 解 编 )。 

@ 然后 执行 字符 串 。 

@ 然后 编码 回复 数据 ( 编组 ) 并 把 它 发 回 套 接 字 。 

请 注意 ， 这 个 程序 只 接收 单个 请 求 。 一 旦 程序 运行 结束 ， 就 不 会 再 接收 新 连接 了 。 

这 个 最 简单 的 服务 表演 示 了 如 何 打 包 和 编码 应 用 程序 煞 据 。 它 接收 一 个 请 求 ， 计 算出 回复 ， 
发 送 回 复 ， 然 后 终止 。 

要 测试 这 个 服务 般 ， 需 要 一 个 对 应 的 客户 闪 。 











socket examples.erl 
nano_client eval(Str) -> 
{ok, Socket} = 
den tcp:connect{"localhost", 2345, 
[binary, {packet, 4}]), 
ok = gen tcp:send(Socket, term to binary {Str)), 
receive 
{tcp,Socket,Bin} -> 
io:format("Client received binary = ~p~n", [Bin]), 
Val = binary to term(Bin), 
io:format ("Cilient result = ~p~n", [Val]), 
gen tcp:close{Socket) 
end. 


为 了 测试 这 些 人 代码， 我们 将 在 同一 台 机 需 上 运行 客户 端 和 服务 禹 ， 这 样 gen_tcp:connect 
国 数 里 的 主机 名 就 是 固定 的 LocaLhost。 

请 注意 客户 闪 如 何 调用 term_to_binary 来 编 但 消息 ， 以 及 服务 硕 如 何 调用 binary_to_- 
term 来 重建 消息 。 

要 运行 它 ， 需 要 打开 两 个 终端 窗口 ， 并 在 每 个 窗口 里 都 局 动 一 个 Erlang shell。 

首先 ， 局 动 服务 规 。 


1> Socket_exampLes:start_nano_server( ) . 

我 们 不 会 在 服务 天 窗口 里 看 到 任何 输出 , 因为 还 没有 什么 事情 发 生 。 然 后 转 到 客户 痪 窗口 并 
输入 以 下 命令 : 

1> socket examples:nano client eval("list to tuple([2+3*4,10+20])"). 

我 们 应 该 会 在 服务 带 窗 口 里 看 到 以 下 输出 : 


Server received binary = <<]131,107,0,28,108,105,115,116,95,116, 
111,95,116,117,112,108,101,40,91,50, 
43,51,42,52,44,49,48,43,50,48,93,41>> 

Server (unpacked) "list to tuple{({2+3*4,10+20])" 

Server replying = {14,30} 


在 客户 剖 徐 口 里 ， 我 们 则 会 看 到 这 些 . 
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Client received binary = <<131,104,2,97,14,97,30>> 
Client result = {14,30} 
ok 


最 后 ， 我 们 会 在 服务 天 窗口 里 看 到 这 个 : 


Server socket closed 


17.1.3 ”顺序 和 并 行 服务 器 


在 上 一 市 里 , 我 们 编写 的 服务 从 只 接收 一 个 连接 就 会 关闭 。 把 这 段 代 码 稍 作 修改 , 我 们 就 能 
写 出 两 种 不 同类 型 的 服务 做。 
口 顺序 服务 帝 : 一 次 接收 一 个 连接 
D 并 行 服务 器 : 同时 接收 多 个 并 行 连 接 
原来 的 代码 开头 是 这 样 的 : 
start nano server() -> 
{ok, Listen} = gen tcp:listen(...), 


{ok, Socket} = gen tcp:accept (Listen), 
loop(Socket)., 





我 们 将 对 它 进行 修改 来 制作 两 种 服务 带 变 体 。 

1. 顺序 服务 器 

为 了 制作 一 个 顺序 服务 融 ， 我 们 把 代码 修改 如 下 : 
start seq server() -> 


{ok, Listen} = gen tcp:listen(...)}), 
seq_ loop(Listen)., 


seq loop(Listen) -> 
{ok, Socket} = gen tcp:accept(Listen), 
loop(Socket), 
seq loop(Listen)., 


loop(..) -> %% 和 之 前 一 样 


它 的 工作 方式 和 前 面 的 例子 基本 一 致 , 但 因为 我 们 想 要 服务 的 请 求 不 止 一 个 , 所 以 让 监听 套 
接 字 保持 打开 状态 ,不 会 调用 gen tcp:close(Listen)。 为 一 处 区 别 是 在 Loop (Socket) 完 成 后 
再 次 调用 seq loop (Listen)， 让 它 等 待 下 一 个 连接 。 

如 果 一 个 客户 端 尝 试 连接 时 服务 器 正 忙 于 处 理 现 有 连接 , 该 连接 就 会 加 入 队列 , 直至 服务 器 
完成 现 有 连接 。 如 果 排 队 的 连接 数量 超过 了 监听 缓冲 区 限制 ， 该 连接 就 会 被 拒绝 。 

我 们 只 展示 了 局 动 服务 需 的 代码 。 停 止 服务 需 很 简单 〈 停 止 并 行 服 务 顺 也 一 样 )， 只 需 终 上 上 
启动 单个 或 多 个 服务 器 的 进程 即 可 。gen_tcp 自 身 会 连接 到 控制 进程 上 ， 如 果 控 制 进 程 终止 ， 它 
就 会 关闭 套 接 字 。 
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2. 并 行 服务 器 
制作 并 行 服 务 器 的 诀窍 是 : 每 当 gen tcp:accept 收 到 一 个 新 连接 时 就 立即 分 裂 一 个 新 进 


start parallel server() -> 


{ok, Listen} = gen tcp:listen(...), 
spawn(fun() -> par_ connect(Listen) end). 





par_ connect(Listen) -> 
{ok, Socket} = gen tcp:accept (Listen), 
spawn (fun() -> par connect(Listen) end), 
loop(Socket)., 


loop(..) -> %% 和 之 前 一 样 


这 段 代 码 类 似 于 之 前 看 到 的 顺序 服务 器 。 关 键 的 区 别 在 于 添加 了 一 个 spawn， 这 就 确保 了 我 
们 会 为 每 个 新 套 接 字 连接 创建 一 个 并 行进 程 。 现 在 是 比较 这 两 者 的 好 机 会 。 你 应 该 观察 spawn 语 
句 的 摆 放 位 置 ， 看 看 它们 是 如 何 把 一 个 顺序 服务 需 转 变 成 并 行 服 务 融 的 。 

这 三 个 服务 器 全 都 调用 了 gen tcp:listen 和 gen tcp:accept， 唯 一 的 区 别 在 于 调用 这 些 
哨 数 时 是 在 并 行程 序 还 是 在 顺序 程序 里 。 














17.1.4 注意 事项 


需要 注意 以 下 几 点 。 

口 创建 某 个 套 接 字 (通过 调用 gen tcp:accept 或 gen tcp:connect ) 的 进程 被 称 为 该 套 接 
字 的 控制 进程 。 所 有 来 目 套 接 字 的 消 明 都 会 被 发 送 到 控制 进程 。 如 果 控 制 进程 挂 了 ， 套 
接 字 就 会 补 关闭。 某 个 套 接 字 的 控制 进程 可 以 通过 调用 gen tcp:controlling_ 
process (Socket，NewPid) 修 改 成 NewPid。 

口 我 们 的 并 行 服务 融 可 能 会 创建 出 几 千 个 连接 ， 所 以 可 以 限制 最 大 同时 连接 数 。 实 现 的 方 
法 可 以 是 维护 一 个 计数 硕 来 统计 任 一 时 刻 有 多 少 活动 连接 。 每 当 收 到 一 个 新 连接 时 就 让 
计数 器 加 1， 每 当 一 个 连接 结束 时 就 让 它 减 1。 可 以 用 它 来 限制 系统 里 的 同时 连接 总 数 。 

口 接受 一 个 连接 后 ， 显 式 设 置 必要 的 套 接 字 选 项 是 一 种 很 好 的 做 法 ， 就 像 这 样 : 

{ok, Socket} = gen tcp:accept(Listen) ， 


inet:setopts(Socket, [{packet,4},binary, 
{nodelay,true}, {active, true}]), 

















Loop (Socket) 

口 Erlang 的 R11B-3 版 开始 允许 多 个 Erlang 进 程 对 同一 个 监听 套 接 字 调用 gen tcp: 
accept/1。 这 让 编号 并 行 服务 亿 变 得 简单 了 ,因为 你 可 以 生成 一 个 预 完 分 裂 好 的 进程 池 ， 
让 它们 都 处 在 gen tcp:accept/1 的 等 待 状态 。 
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17.2 ”主动 和 被 动 套 接 字 


Erlang 的 套 接 字 可 以 有 三 种 打开 模式 :主动 (active )、 单 次 主动 ( active once ) 或 被 动 ( passive )。 
这 是 通过 在 gen tcp:connect(Address，Port，0ptions) 或 gen tcp:listen(Port, 0ptions) 
的 0ptions 参 数 里 加 入 {active，true | false | once} 选 项 实现 的 。 
如 采 指 定 {active，true} 就 会 创建 一 个 主动 套 接 字 ， 指 定 {active，false} 则 是 被 动 僚 接 
字 。{active，once} 创 建 的 套 接 字 只 会 主动 接收 一 个 消息 ， 接 收 完 之 后 必须 重新 启用 才能 接收 
下 一 个 消息 。 
我 们 将 在 接 下 来 的 几 节 里 介绍 这 些 不 同类 型 套 接 字 的 用 途 。 
主动 和 被 动 套 接 字 的 区 别 在 于 套 接 字 接 收 到 消息 之 后 所 发 生 的 事 。 
口 当 一 个 主动 套 接 字 被 创建 后 ， 它 会 在 收 到 数据 时 癌 控 制 进程 发 送 {tcp，Socket，Data} 
消息 。 控 制 进程 无 法 控制 这 些 消息 流 。 和 恶意 的 客户 问 可 以 同系 统 发 送 成 二 上 万 的 消息 ， 
而 它们 都 会 被 发 往 控 制 进程 。 欣 制 进程 无 法 阻止 这 些 消息 流 。 
口 如 采 一 个 艾 接 字 是 用 被 动 模 式 打开 的 ， 控 制 进 程 惑 必须 调用 gen_tcp: recv(Socket，N) 
来 从 这 个 套 接 字 接 收 数据 。 然 后 它 会 答 试 从 套 接 字 接 收 N 个 字 下 。 如 末 N = 0， 套 接 字 就 
会 返回 所 有 可 用 的 字 节 。 在 这 个 案例 里 ， 服 务 磊 可 以 通过 选择 何 时 调用 gen_tcp: recv 来 
控制 客户 端 所 发 的 消息 流 。 
被 动 套 接 字 的 作用 是 控制 通 往 服务 需 的 数据 流 。 要 演示 这 一 点 , 我 们 可 以 用 三 种 方式 编写 服 
务 右 的 消 县 接收 循环 。 
口 主动 消 明 接收 ( 非 阻 窄 式 ) 
口 饭 动 消 奶 接收 ( 阻 窒 式 ) 
口 混合 消 朋 接收 ( 部 分 阻 突 式 ) 


















































17.2.1 主动 消息 接收 《〈 非 阻塞 式 ) 
第 一 个 例子 用 主动 模式 打开 一 个 套 接 字 ， 然 后 从 这 个 套 接 字 里 接 收 消 息 。 


{ok, Listen} = gen tcp:listen(Port, [..,{active, true}...]), 
{ok, Socket} = gen tcp:accept (Listen), 
Loop(Socket ) ， 








loop(Socket) -> 
receive 
{tcp, Socket, Data} -> 
， 对 数据 进行 操作 ... 
{tcp closed, Socket} -> 


end., 
这 个 进程 无 法 控制 通 往 服 务 希 循环 的 消息 流 。 如 有 果 客 户 端 生成 数据 的 速度 快 于 服务 需 处 理 数 
据 的 速度 ， 系 统 就 会 遭受 数据 洪流 的 冲击 : 消息 绥 冲 区 会 被 塞 满 ， 系 统 可 能 会 月 沉 或 表现 异常。 
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这 种 类 型 的 服务 胡 被 称 为 非 阻塞 式 服务 带 , 因为 它 无 法 阻挡 客户 端 。 只 有 在 确信 服务 带 能 跟 
上 客户 端的 需求 时 才 会 编写 非 阻 窒 式 服务 带 。 


17.2.2 被动 消 息 接 收 〈 阻 塞 式 ) 


在 这 一 节 里 ， 我 们 将 编写 一 个 阻 堵 式 服 务 硕 。 这 个 服务 善 通过 设置 {active，faLse} 选 项 
用 被 动 模式 打开 套 接 字 。 这 个 服务 如 不 会 因为 某 个 过 激 的 客户 问 试 图 用 过 量 数据 冲击 它 而 月 尝 。 

服务 器 循环 里 的 代码 会 在 每 次 想 要 接收 数据 时 调用 gen tcp: recv。 客 户 端 会 一 直 被 阻塞 ， 
直到 服务 天 调用 recv 为 止 。 请 注意 ， 操 作 系统 有 上 自己 的 缓冲 设置 ， 即 使 没有 调用 recv， 客 户 端 
也 能 在 阻 考 前 发 送 少量 数据 。 

{ok, Listen} 


{ok, Socket} 
loop(Socket)., 











gen tcp:listen(Port, [..,{active, false}...]), 
gen tcp:accept (Listen), 


loop(Socket) -> 
case gen tcp:recv(Socket, N) of 
{ok, B} -> 
， 对 数据 进行 操作 ... 
loop(Socket); 
{error, closed} 


end . 


17.2.3 混合 消息 接收 “部 分 阻 压 式 ) 


你 可 能 会 认为 对 所 有 服务 天 都 使 用 被 劲 模式 是 正确 的 做 法 。 只 不 过 , 当 我 们 处 于 被 动 模 式 时 ， 
只 能 等 待 来 日 单个 套 接 字 的 数据 。 这 对 于 编写 那些 必须 等 竺 来 目 多 个 套 接 字 数据 的 服务 需 来 说 坚 
无 用 处 。 

幸运 的 是 ， 我 们 可 以 采用 一 种 混合 方式 ， 既 不 是 阻塞 也 不 是 非 阻 塞 。 用 {factive，once} 选 
项 打开 套 接 字 。 套 接 字 在 这 个 模式 下 虽然 是 主动 的 , 但 只 针对 一 个 消息 。 当 控制 进程 收 到 一 个 消 
县 后 ,必须 显 式 调用 inet:setopts 才 能 重 局 下 一 个 消息 的 接收 , 在 此 之 前 系统 会 处 于 阻 星 状态 。 
这 种 方法 集合 了 前 两 种 模式 的 优点 ， 它 的 代码 如 下 : 

{ok, Listen} = gen tcp:listen(Port, [..,{active, once}...1), 


{ok, Socket} gen_ tcp:accept (Listen), 
loop(Socket). 























loop(Socket) -> 
receive 
{tcp, Socket, Data} -> 
， 对 数据 进行 操作 ... 
%%6 ' 当 你 准备 好 启动 下 一 个 消息 的 接收 时 
inet:setopts(Sock, [{active, once}]), 
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loop(Socket), 
{tcp closed, Socket} -> 


end. 


通过 使 用 {active, once} 选 项 , 用 户 可 以 实现 高 级 形式 的 流量 控制 (有 时 被 称 为 流量 整形 )， 
从 而 防止 服务 器 被 过 多 消息 淹没 。 








找 出 连接 的 来 源 
假设 编写 了 某 种 在 线 服 务 器 ， 并 且 发 现 有 人 持续 向 网 站 发 送 垃 圾 信息 。 为 了 尽量 防止 这 
种 事 发 生 ， 我 们 需要 知道 连接 的 来 源 。 可 以 调用 inet:peername(Socket) 进 行 查看 。 


Gspec inet:peername(Socket) -> {ok, {IP Address, Port}} | {error, Why} 


它 会 返回 连接 另 一 端的 地 址 和 端口 号 , 这 样 服务 器 就 能 看 到 是 谁 发 起 的 连接 , IP Address 
是 一 个 由 整数 组 成 的 元 组 ，{N1,N2,N3,N4} 代 表 IPv4 地 址 ，{K1,K2,K3,K4,K5,K6,K7,K8} 代 
表 IPV6 地 址 。 这 里 的 凡是 0 到 255 之 间 的 整数 ，Ki 是 0 到 65535 之 间 的 整数 ， 


17.3” 套 接 字 错 误 处 理 


套 接 字 的 错误 处 理 极其 简单 ， 基 本 上 你 什么 都 不 用 做 。 正 如 我 们 之 前 所 说 的 ， 每 个 套 接 字 都 
有 一 个 控制 进程 (也 就 是 创建 该 套 接 字 的 进程 )。 如 果 控 制 进程 挂 了 ， 套 接 字 就 会 被 自动 关闭 。 

这 意味 着 什么 呢 ? 举 个 例子 , 如 果 我 们 有 一 个 客户 端 和 一 个 服务 姨 , 而 服务 右 因 为 程序 错误 
挂 了 ,那么 服务 右 支 配 的 套 接 字 就 会 被 日 动 关 闭 ， 同 时 间 客 户 端 发 送 一 个 {tcp_closed, Socket} 
消 筷 s 

可 以 用 下 面 这 个 小 程序 来 测试 一 下 这 种 机 制 |: 



































socket_examples.erl 


error test{() -> 
spawn (fun() -> error test server() end), 
lib misc:steep(2060) ， 
{ok,Socket} = gen tcp:connect("Liocathost",4321,{[binary, {packet, 2}1), 
io:format("connected to:~p~n", [Socket]), 
gen tcp:send{({Socket, <<"123">>), 
receive 
Any -> 
ijo:format("Any=~p~n", [Any]) 
end., 
error test server() -> 
{ok, Listen} = gen tcp:listen(4321, [binary, {packet,2}]), 
{ok, Socket} = gen tcp:accept (Listen), 
error test server loop(Socket). 
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error test server loop{Socket) -> 
receive 
{tcp, Socket, Data} -> 
io:format ("received:~p~n", [Datal), 
_ = atom to list(Data), 
error test server loop(Socket) 
end. 


运行 它 时 会 看 到 以 下 输出 : 


1> socket examples:error test( ) ， 

connected to:#Port<0.152> 

received:<<"123">> 

=ERROR REPORT==== 30-Jan-2009: :16:57:45 === 

Error in process <0.77.0> with exit value: 
{badarg, [{erlang,atom to list, [<<3 bytes>>]}, 
{socket examples,error test server loop,1}]} 

Any={tcp closed,#Port<0.152>} 

ok 


我 们 分 裂 出 一 个 服务 各 并 睡 虐 两 秒 钟 来 让 它 完 成 启动 ， 然 后 问 它 发 送 一 个 包含 二 进 制 型 
<<"123">> 的 消息 。 当 这 个 消息 到 达 服 务 规 后 ， 服 务 关 和 莹 试 对 二 进 制 型 Data 计 算 
atom_to_List(Data) ， 于 是 立即 居 溃 了 。 系 统 监视 上 锅 打 印 出 了 你 在 shell 里 所 见 到 的 诊断 信息 。 
因为 服务 需 端 套 接 字 的 控制 进程 已 经 月 溃 ， 所 以 (服务 融 端的 ) 套 接 字 就 被 目 动 关闭 了 。 系 统 随 
后 回 客 户 闪 发 送 一 个 {tcp_cLosed，Socket} 消 息 。 











17.4 UDP 


现在 让 我 们 来 看 看 用 户 数据 报 协议 (UDP )。 互 联网 上 的 机 需 能 够 通过 UDP 相互 发 送 被 称 为 
数据 报 ( datagram ) 的 短 消 息 。UDP 数 据 报 是 不 可 敌 的 ， 这 就 意味 着 如 果 客 户 端 回 服务 天 发 送 一 
串 UDP 数 据 报 ， 它们 可 能 会 不 按 顺 序 到 达 , 不 能 成 功 到 达 或 者 不 止 一 次 到 达 。 但 是 每 一 个 数据 报 
只 要 到 达 ， 就 会 是 完好 无 损 的 。 大 型 数据 报 可 以 被 拆 分 成 若干 个 小 片段 ,但 IP 协 议会 在 传输 到 应 
用 程序 之 前 重新 组 合 这 些 片 段 。 

UDP 是 一 种 无 连接 协议 ， 意 思 是 客户 端 回 服务 融 发 送 消 息 之 前 不 必 建 立 连 接 。 这 就 意味 痢 
UDP 非常 适合 那些 大 量 客 户 端 回 服 务 硕 发 送 简短 消息 的 应 用 程序 。 

用 Erlang 编 写 UDP 客 户 疹 和 服务 硕 要 比 编写 TCP 程 序 简 单 得 多 ， 因 为 我 们 无 需 担心 服务 胡 连 
接 的 维护 工作 。 









































17.4.1 最 简单 的 UDP 服务 器 与 客户 端 
首先 来 讨论 服务 器 。UDP 服 务 器 的 基本 形式 如 下 ， 


server(Port) -> 
{ok, Socket} = gen udp:open(Port, [binary]), 
loop(Socket). 
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loop(Socket) -> 


receive 
{udp, Socket, Host, Port, Bin} -> 
BinReply = .,，， 
gen udp:send(Socket, Host, Port, BinReply), 
loop(Socket) 
end., 








这 比 TCP 程 序 要 容易 一 些 ， 因 为 无 需 担 心 如 何 让 进程 接收 “ 釜 接 子 关 闭 ” 的 消 肯 。 请 注意 ， 
我 们 用 binary 模 式 打 开 了 侄 接 字 , 它 告诉 驱动 要 把 所 有 消 奶 以 二 进 制 数 据 的 形式 发 送 给 控制 进程 。 

接 下 来 是 客户 端 。 这 里 有 一 个 非 第 简单 的 客户 痢 。 它 只 是 打开 一 个 UDP 套 接 字 ,向 服务 带 发 
送 一 个 消息 ， 等 符 回 复 〈 或 者 超时 )， 然 后 关闭 套 接 字 并 返回 服务 大 的 返回 值 。 


clijent(Request) -> 
{ok, Socket} = gen udp:open(0, [binary]), 
ok = gen udp:send(Socket, "iliocalhost", 4000, Request), 
Value = receive 
{udp, Socket, ， ，, Bin} -> 
{ok, Bin} 
after 2000 -> 
error 
end, 
gen_ udp:close(Socket), 
Value 


必须 设置 一 个 超时 ， 因 为 UDP 是 不 可 徘 的 ， 我 们 可 能 会 得 不 到 回复 。 

















17.4.2 ”一 个 UDP 阶乘 服务 器 


可 以 很 轻松 地 创建 一 个 服务 带 , 让 它 用 发 送 给 它 的 任意 数字 计算 我 们 的 老 朋 友 一 一 阶乘 。 这 
段 代码 建立 在 上 一 市 的 基础 之 上 。 











udp_test.erl 


-modutle(udp test). 
-export([{start server/0, client/1}). 


start server() -> 
spawn (fun{) -> server(4000) end). 


%% 服务 器 

server{Port) -> 
{ok, Socket} = gen udp:open(Port, [binary]), 
ijo:format{"server opened socket:~p~n", {Socket]), 
tloop(Socket). 


Tloop{Socket) -> 
receive 
{udp, Socket, Host, Port, Bin} = Msg -> 
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io:format("server received:~p~n", [Msg]), 
N = binary to term(Bin), 


Fac = fac(N), 
gen udp:send(Socket, Host, Port, term to binary (Fac)), 
loop(Socket) 
end . 
fac(0) -> 1; 


fac(N) -> N * fac(N-1)}). 





Dd 


A 


oo 


% 客户 ; 


client(N) -> 
{ok, Socket} = gen udp:open(0, [binary]), 
io:format("client opened socket=~p~n", [Socket]), 
ok = gen udp:send(Socket, "tLlocalhost", 4000, 
term to binary(N)), 
Value = recelve 
{udp, Socket, ， , Bin} = Msg -> 
io:format("client received:~p~n", [Msg]), 
binary_ to term(Bin) 
after 2000 -> 
0 
end, 
gen udp:close(Socket), 
Value. 


请 注意 , 我 添加 了 一 些 打印 语句 , 这 样 就 能 看 到 程序 运行 时 发 生 了 什么 。 我 在 开发 程序 时 总 
会 添加 一 些 打印 语句 ， 然 后 在 程序 能 正 第 工作 时 编辑 或 注释 挥 它们 。 
现在 来 运行 这 个 示例 。 痛 和 完 ， 局 动 服务 带 。 


1> udp test:start server(). 
server opened socket:#Port<0.,106> 
<0 ,34.0> 


它 在 后 台 和 运行， 这 样 我 们 就 可 以 生成 一 个 请 求 40 阶 乘 值 的 客户 站 请 求 。 


2> udp_ test:client(40). 
client opened socket=#PoOrt<0 ,105> 
server received: {udp,#Port<0.106>,1{127,0,0,1},32785,<<131,97,40>>} 
client received: {udp,#Port<0.105>, 
{127,0,0,1}, 4000, 
<<131,110,20,0,0,0,0,0,64,37,5,255, 
100 ,222,15,8,126,242,199,132,27, 
232,234,142>>} 
815915283247897734345611269596115894272000000000 


现在 就 得 到 了 一 个 小 小 的 UDP 阶 乘 服务 从 。 为 了 找 操 朱 于 ,你 可 以 试 厦 编 号 这 个 程序 的 TCP 
版 本 ,然后 对 它们 进行 基准 测试 来 加 以 比较 。 
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17.4.3 UDP 效 据 包 须知 


要 注意 的 是 , 因为 UDP 是 一 种 无 连接 协议 , 所 以 服务 需 无 法 通过 拒绝 谈 取 来 目 东 个 客户 端的 
数据 来 阻挡 它 。 服 务 器 对 谁 是 客户 端 一 无 所 知 。 

大 型 UDP 数据 包 可 能 会 分 段 通过 网 络 。 当 UDP 数据 经 过 网 络 上 的 路 由 需 时 ,如果 数据 大 小 超 
过 了 路 由 答 允 许 的 最 大 传输 单元 (Maximum Transfer Unit， 人 简称 MTU ) 大 小 ， 分 段 束 会 发 生 。 通 
各 的 建议 是 在 调整 UDP 网 络 时 从 一 个 较 小 的 数据 包 大 小 开始 (比如 大 约 500 字 节 ), 然后 逐步 增 大 
并 测量 吞吐 量 。 如 果 厨 吐 量 在 某 个 时 刻 又 减 ， 你 就 知道 数据 包 太 大 了 。 

UDP 数据 包 可 以 传输 两 次 (这 出 乎 一 些 人 的 意料 之 外 )， 所 以 在 编号 远程 过 程 调 用 代码 时 一 
定 要 小 心 。 第 二 次 查询 得 到 的 回复 可 能 只 是 第 一 次 查询 回复 的 复制 。 为 防止 这 类 问题 ,可 以 修改 
客户 交代 码 来 加 入 一 个 唯一 的 引用 , 然后 检查 服务 从 是 否 返 回 了 这 个 引用 。 要 生成 一 个 唯一 的 引 
用 , 需要 调用 Erlang 的 内 置 哨 数 make_ref， 它 能 确保 返回 一 个 全 局 唯一 的 引用 。 远 程 过 程 调 用 的 
代码 现在 看 起 来 就 像 这 样 : 

client(Request) -> 

{ok, Socket} = gen udp:open{(0, [binary]}), 
Ref = make ref{)，%% 生成 一 个 唯一 的 引用 
Bl = term to binary({Ref, Request}), 


ok = gen udp:send(Socket, "localhost", 4000, B1), 
wait for ref(Socket, Ref). 















































wait for ref{({Socket, Ref) -> 
receive 
{udp, Socket, ， ，, Bin} -> 
case binary to term(Bin) of 
{Ref, Val} -> 
%% 得 到 的 是 正确 什 
Val; 
{ SomeOtherRef, } -> 
%% 其 他 值 则 丢弃 
walt for ref{Socket, Ref) 
end ; 
after 1000 -> 


end. 
以 上 就 是 UDP 的 相关 介绍 。 UDP 经 常用 于 有 低 延 迟 要 求 的 在 线 游戏 , 对 它们 来 说 是 否 偶尔 丢 
包 则 无 天 紧要 。 


17.5 ”对 多 台 机 器 广播 
最 后 来 看 如 何 设立 一 个 广播 信道 。 它 的 代码 很 简单 。 
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broadcast.erl 


-module(tbroadcast). 
-compile(export all). 


send(IoList) -> 
case inet:ifget("etheg", [broadaddr]) of 
{ok, [{broadaddr, Ip}]} -> 
{ok, 5S} = gen udp:open(5010, [{broadcast, true}]), 
gen udp:send(S, Ip, 6000, IoList), 
gen udp:close(S),; 
-> 
io:format("Bad interface name, orin" 
"broadcasting not supported\n") 


end. 


listen() -> 
{ok, } = gen udp:open'(6000), 
loop()., 
loop() -> 
receive 
Any -> 
lo:format("received:~p~n", [Any]), 
Loop() 
endj ， 


在 这 里 需要 两 个 端口 , 一 个 发 送 广播 ,， 另 一 个 监听 回应 。 我 们 选择 了 5010 端 口 来 发 送 广播 请 
求 ，6000 端 口 用 来 监听 广播 (这 两 个 数字 没有 特殊 含义 ,我 只 是 选择 了 系统 里 两 个 空闲 的 端口 )。 

只 有 发 送 广播 的 进程 才 会 打开 5010 端 口 ， 而 网 络 上 的 所 有 机 天 都 会 调用 broadcast:Listen() 
来 打开 6000 端 口 并 监听 广播 消息 。 

broadcast:send(IoList) 会 对 局 域 网 里 的 所 有 机 融 广 播 IoList。 





注意 ”要 让 它 正 常 工 作 ， 接 口 名 必须 正确 ， 而 且 系 统 必 须 支 持 广 播 。 比 如 ， 我 在 iMac 上 使 用 了 
“en0” 而 非 “eth0 。 另 外 要 注意 的 是 ， 如 果 运 行 UDP 监听 程序 的 主机 属于 不 同 的 子 网 ， 
就 不 太 可 能 收 到 UDP 广播 ， 因 为 路 由 器 会 默认 丢弃 这 样 的 UDP 广播 。 


17.6 一 个 SHOUTcast 服务 器 


在 这 一 草 的 最 后 ， 我 们 将 运用 新 学 到 的 套 接 字 编程 技术 来 编写 一 个 SHOUTcast 服 务 病 。 
SHOUTcast 是 由 Nullsoft 公 司 开发 的 协议 , 它 被 用 于 传输 音频 数据 流 "。SHOUTcast 使 用 HTTP 作 为 
传输 协议 来 发 送 MP3 或 AAC 编 码 的 音频 数据 。 

为 了 了 解 这 一 切 是 如 何 工作 的 ， 首先 来 看 SHOUTcast 协 议 , 然后 是 服务 器 的 整体 架构 ， 并 在 
最 后 展示 代码 。 














GD http://www.shoutcast.com/ 
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17.6.1 SHOUTcast 协 议 


SHOUTcast 协 议 很 简单 。 

(1) 首先 , 客户 端 ( 例 如 XMMS 、Winamp 或 iTunes ) 发 送 一 个 HTTP 请 求 到 SHOUTcast 服 务 需 。 
这 是 我 在 家 里 运行 SHOUTcast 服 务 器 时 XMMS 生 成 的 请 求 : 

GET / HTTP/1.,1 

Host: localhost 


User-Agent: xmms/1.2.10 
Icy-MetaData:l1 


(2) SHOUTcast 服 务 需 的 回复 是 : 


ICY 200 OK 
jcy-noticel: <BR>This stream reqyires 

<a href=http://www.winamp. com/>;Winamp</a><BR> 
1ICY-notice2: Erlang Shoutcast server<BR> 
jcy-name: Erlang mix 
jcy-genre: Pop Top 40 Dance Rock 
licy-url: http://localhost:3000 
content-type: audio/mpeg 
ijcy-pub: 1 
icy-metaint: 24576 
ijcy-br: 96 

i 


(3) 现在 SHOUTcast 服 务 融 会 发 送 连续 的 数据 流 。 这 个 数据 流 具 有 如 下 结构 : 

FHFHFHF... 

F 是 一 个 MP3 音 频数 据 块 ， 它 的 长 度 必须 刚好 是 24 576 字 节 ( icy-metaint 参 数 的 值 )。H 是 
一 个 数据 头 ， 由 单字 节 的 K 后 接 16*K 字 节 的 数据 组 成 。 因 此 ， 可 以 用 二 进 制 型 表示 的 最 小 数据 头 
是 <<0>>。 接 下 来 的 数据 头 可 以 这 样 表示 : 

<<1,B1,B2, ..., B16>> 

它 的 数据 部 分 是 一 个 StreamTitle=' ... ';StreamUrl='http:// ...'; 形 式 的 字符 串 ， 
长 度 不 足 则 在 右边 补 零 ， 下 到 项 满 整个 数据 头 。 




















17.6.2 SHOUTcast 服 务 器 的 工作 原理 


要 制作 一 个 服务 器 ， 必 须 考 虑 到 以 下 细节 。 

(1) 制作 一 个 播放 列表 。 我 们 在 16.2.5 节 的 “ 读 取 MP3 元 数据 ”部 分 创建 了 一 个 包含 歌 名 清单 
的 文件 ， 服 务 需 将 使 用 这 个 文件 。 音 频 文件 将 从 清单 里 随机 选择 。 

(2) 制作 一 个 并 行 服务 硕 ， 这 样 就 能 并 行 传输 多 个 流 。 我 们 将 使 用 17.1.3 节 中 “并 行 服务 瑚 ” 
部 分 描述 的 方法 。 
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(3) 我 们 只 想 发 送 各 个 音频 文件 的 音频 数据 到 客户 端 , 而 不 包括 内 散 的 ID3 标 签 。 音频 编码 器 
理应 能 跳 过 损坏 的 数据 ， 所 以 原则 上 可 以 把 ID3 标 签 和 数据 一 起 发 送 。 然 而 在 实践 中 ， 似 乎 需要 
移 除 ID3 标 签 才 能 让 程序 更 好 地 运行 。 

使 用 code/id3 tag_Lengths .erL 里 的 代码 来 移 除 标签 ， 它 位 于 本 书 可 供 下 载 的 源 代码 中 ”。 





17.6.3 SHOUTcast 服 务 器 的 伪 代 码 
在 展示 最 终 程序 之 前 ， 先 来 看 看 省 略 了 细 市 部 分 的 整体 代码 流 。 


start parallel server(Port) -> 
{ok, Listen} = gen tcp:listen(Port, ..), 
%% 创建 一 个 歌曲 服务 器 ， 它 了 解 我 们 的 所 有 音乐 
PidSongServer = Spawn(fTun() -> Songs() end ) ， 
spawn (fun() -> par connect(Listen, PidSsongServer) end ) ， 








%% 为 每 个 连接 分 彩 一 个 这 样 的 进程 
par connect(Listen, PidSsongServer) -> 
{ok, Socket} = gen tcp:accept (Listen), 
%% 在 aCCept 返 回 时 分 裂 一 个 新 进程 来 等 待 下 一 个 连接 
spawn(fun() -> par connect(Listen, PidSongServer) end ) ， 
inet:setopts(Socket, [{packet,0},binary, {nodelay,true}, 
{active, true}]), 
%%5 处 理 请 求 
get request(Socket, PidSongServer, []). 


%% 等 待 TCP 请 求 
get request(Socket, PidSongServer, L) -> 
receive 
{tcp, Socket, Bin} -> 
:Bin 包含 来 自 客户 广 的 请 求 
: 如 果 请 求 是 分 段 的 就 再 次 调用 循环 ， 
， 五 则 调用 got request(Data, Socket,PidSongServer) 
{tcp closed, Socket} -> 
， 这 是 针对 客户 问 在 发 送 请 求 之 前 就 已 中 止 的 情况 (非常 罕见 ) 
end. 


%% 我 们 接 到 了 请 求 ， 发 送 一 个 回复 
got request(Data, Socket, PidSongServer) -> 
: Data 是 来 自 客户 妆 的 请 求 ..， 
i 
..， 我 们 将 始终 满足 请 求 ,,， 
gen tcp:send(S9ocket，[response()] )， 
play_songs(Socket, PidSongServer). 


%% 持续 播放 歌曲 直到 客户 闯 退 出 


GD http://pragprog.com/titles/jaerlang2/source code 
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play_ songs(Socket, PidSongServer) -> 
: PidSongServer 持 有 一 份 MP3 文 件 清单 
Song = rpc(PidSongServer, random song), 
: Song 是 一 首 随 机 歌曲 ... 
Header = make header(Song), 
， 生 成 数据 头 ，.. 
{ok, 5S} = file:open(File, [read,binary,raw]), 
send file(1, 5, Header, 1, Socket), 
file:close(S), 
play_songs(Socket, PidSongServer). 
send file(K, $5, Header, OffSet, Socket) -> 
i 人 什 分 决 发 送 络 客户 广 训 和 
， 发 送 完整 个 文件 就 返回 ，, 
， 但 如 果 写 入 套 接 字 出 错 则 退出 ， 
， 这 会 发 生 在 客户 痛 退 出 时 


如 果 你 查看 真实 的 代码 ， 就 会 发 现 细节 稍 有 不 同 , 但 它们 的 原理 是 相同 的 。 完 整 的 代码 清 
不 会 在 这 里 展示 ,但 可 以 在 文件 code/shout.erl 里 找到 。 











17.6.4 ”运行 SHOUTcast 服 务 器 


要 运行 服务 需 并 看 看 它 能 否 工作 ， 需 要 执行 下 列 步骤 。 

(1) 制作 一 个 播放 列表 。 

(2) 启动 服务 右 。 

(3) 将 一 个 客户 问 指 回 服务 从。 

制作 列表 需要 以 下 三 步 。 

(1) 移 至 代码 目录 。 

(2) 编辑 mp3_manager.erl 文 件 里 start1 扬 数 的 路 径 , 让 它 指向 竺 输出 音频 文件 所 属 目 录 的 
根 目录 。 

(3) 编译 mp3 manager， 然 后 输入 命令 mp3 manager:start1l()。 应 该 能 看 到 如 下 输出 : 

1> Ctmp3 manager ) . 

{ok,mp3 manager} 

2> mp3 manager:startl(). 


Dumping term to mp3data 
ok 


如 果 有 兴趣 ， 现 在 可 以 查看 mp3data 文 件 来 了 解 分 析 结 果 。 
现在 可 以 局 动 SHOUTcast 服 务 器 了 。 


1> shout:start(). 











要 测试 这 个 服务 右 ， 请 执行 下 列 操 作 。 
(1) 去 为 一 个 和 窗口 打开 某 个 音频 播放 各 ， 将 它 指 问 http://TLocalhost:3000 上 的 流 服 务 。 
我 的 系统 使 用 XMMS， 命令 如 下 : 
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xmms http://localhost:3000 
注意 ”如果 想 从 另 一 人 台 计 算 机 访问 这 个 服务 器 ， 就 必须 提供 服务 器 所 运行 机 器 的 IP 地 址 。 举 个 


例子 ,要 用 我 Windows 机 器 上 的 Winamp 访 问 服务 器 ,我 会 打开 Winamp 的 “播放 ”>“URL” 
菜单 ， 然 后 在 “打开 URL” 对 话 框 里 输入 地 址 http://192.168.1.168:3000。 








如 采用 的 是 iMac 上 的 iTunes， 我 就 会 在 “高 级 ”> “打开 流 ” 亲 单 里 输入 上 面 的 URL 来 访问 
服务 大 。 

(2) 你 会 在 启动 服务 需 的 窗口 里 看 到 一 些 诊 断 输出 。 

(3) 尽情 享受 吧 1 

在 这 一 章 ， 我 们 只 介绍 了 最 稼 用 的 套 接 字 操作 咽 数 。 可 以 在 gen_ tcp、gen udp 和 inet 的 手 
册页 里 找到 更 多 有 关 套 接 字 API 的 信息 。 

有 了 一 个 简单 的 套 接 字 接口 ， 再 加 上 内 置 亢 数 term_to_binary/1L 和 它 的 逆 国 数 binary 
to_term， 网 络 编程 就 变 得 很 容易 了 。 建 议 你 完成 下 面 这 些 练习 来 获得 第 一 手 的 体验 。 

在 下 一 草 ， 我 们 将 来 学 习 WebSocket。Erlang 进 程 可 以 通过 WebSocket 直 接 与 Web 浏 览 夯 通信 
(无 需 逐 循 HITTP 协 议 ), 它 是 实现 低 延 人 运 Web 应 用 程序 的 理想 方式 , 也 提供 了 一 种 编写 Web 应 用 程 
序 的 催 单 方法 。 


























17.7 练习 


(1) 修改 nano_get_ur1/9 的 代码 (017.1.17 )， 并 在 必要 时 诬 加 合适 的 HITP 头 或 执行 重 定 加 
来 获取 任意 网 页 。 在 多 个 网 站 上 测试 它 。 

(2) 输入 17.1.2 节 里 的 代码 ， 然 后 修改 此 代码 来 接收 一 个 {Mod，Func，Args} 元 组 〈 而 不 是 
字符 串 )， 最 后 计算 Reply = appLy(Mod，Func，Args) 并 把 值 发 回 套 接 字 。 

编写 一 个 nano_cLient_evatL(Mod，Func，Args) 函 数 〈 类 似 于 本 章 前 面 所 展示 的 版 本 )， 
让 它 用 修改 版 服务 器 代码 能 理解 的 形式 编码 Mod、Func 和 Arity。 

测试 客户 端 和 服务 需 代 码 能 和 否 正常 工作 , 首先 在 同一 台 机 右上, 然后 在 同一 局 域 网 的 两 台 机 
器 上 ， 最 后 在 互联 网 上 的 两 侣 机 需 上 。 

(3) 用 UDP 代 赫 TCP 重 复 上 一 个 练习 。 

(4) 添加 一 个 加 密 层 ， 做 法 是 先 编码 二 进 制 型 再 发 送 给 输出 套 接 字 ， 并 在 输入 套 接 字 接收 之 
后 立即 解码 。 

(5) 制作 一 个 简单 的 “类 电子 邮件 ”系统 。 把 Erlang 数 据 类 型 作为 消息 存储 在 ${HOME}/mbox 
目录 里 。 












































用 WebSocket 和 Erlang 
进行 浏览 





在 这 一 章 里 ， 我 们 将 来 看 看 如 何在 浏览 融 里 构建 应 用 程序 ， 把 消息 传递 这 个 概念 延伸 到 
Erlang 之 外 。 通 过 这 种 方式 ， 就 可 以 轻松 构建 分 布 式 应 用 程序 ， 并 将 它们 与 Web 浏 览 带 整合 在 一 
起 。Erlang 认 为 Web 浏 览 嚣 只 不 过 是 男 一 个 Erlang 进 程 ， 这 就 简化 了 我 们 的 编程 模型 ,把 一 切 都 放 
进 了 同一 个 概念 框架 内 。 

假设 Web 浏 览 间 是 一 个 Erlang 进 程 。 如果 我 们 想 让 浏览 妖 做 点 什么 ,就 会 问 它 发 送 一 个 消息 。 
如 采 浏 览 硕 里 发 生 了 需要 我 们 处 理 的 事情 , 它 就 会 回 我 们 发 送 一 个 消息 。 让 这 一 切 成 为 可 能 的 是 
WebSocket ( Web 套 接 字 )。WebSocket 是 HTMLS 标 准 的 一 部 分 ， 它 是 一 种 双向 异步 套 接 字 ， 可 以 
用 来 在 浏览 硕 和 外 部 程序 之 间 传 递 消 息 。 对 我 们 来 说 ， 这 个 外 部 程序 就 是 Erlang 运 行 时 系统 。 

为 了 给 Erlang 运 行 时 系统 建立 WebSocket 接 口 ， 就 会 运行 一 个 名 为 cowboy (牛仔 ) 的 简单 
Erlang 服 务 硕 ， 让 它 管理 套 接 字 和 WebSocket 协 议 。 第 25 章 会 详细 介绍 如 何 安 闻 cowboy。 为 了 从 
化 讨论 ， 我 们 假定 Erlang 和 浏览 问 之 间 传 递 的 所 有 消 奶 都 是 JSON 格 式 的 。 

这 些 消 息 在 应 用 程序 的 Erlang 端 体现 为 Erlang 上 映射 组 (参见 5.3 节 )， 在 浏览 右 里 则 体现 为 
JavaScript 对 象 。 

在 本 章 后 续 部 分 , 我 们 将 看 到 六 个 示例 程序 , 它们 包括 在 浏览 硕 里 运行 的 代码 和 在 服务 需 里 
运行 的 代码 。 最 后 ， 来 看 客户 端 -服务 关 协议 ， 了 解 它 如 何 处 理 从 Erlang 到 浏览 规 的 消息 。 

运行 这 些 示 例 需 要 三 样 东 西 : 一 些 运 行 在 浏览 锅 里 的 代码 ， 一 些 运行 在 Erlang 服 务 硕 里 的 代 
仔 ， 以 及 一 个 能 理解 WebSocket 了 苏 议 的 Erlang 服 务 硕 。 我 们 不 会 展示 所 有 的 代码 ， 只 针对 在 浏览 
大 和 服务 融 里 运行 的 代码 ， 服 务 硕 目 身 的 代码 也 不 会 展示 。 所 有 示例 都 可 以 在 https:/github.comy/ 
joearms/ezwebframe 里 找到 。 示 例 里 的 浏览 硕 代 码 只 在 Chrome 浏 览 硕 里 测试 过 。 



































注意 ”这 里 展示 的 代码 是 ezwebframe 数 据 仓 库 所 存 代 码 的 简化 版 ， 它 们 是 用 映射 组 编写 的 。 数 
据 仓 库 里 的 代码 与 Erlang 分 发 套装 保持 同步 ， 会 在 Erlang 的 R17 版 引入 映射 组 后 反映 出 
Erlang 的 变化 。 


要 杀 目 运行 这 些 代 码 ,， 你 需要 下 载 它 们 并 执行 安 妆 交互 操作 。 对 我 们 而 言 ， 代 码 中 有 趣 的 部 
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分 是 运行 在 浏览 规 和 服务 套 里 的 那些 。 

所 有 示例 都 使 用 一 种 简单 的 方法 来 让 Erlang 探 制 浏 览 句 。 如 果 Erlang 想 让 浏览 句 做 些 什 么 ， 
就 回 浏 览 需 发 送 一 个 消息 来 告诉 它 。 如 果 用 户 想 要 做 些 人 什么, 束 点 击 浏览 套 里 的 某 个 按钮 或 其 他 
控件 ， 生 成 一 个 消息 发 给 Erlang。 第 一 个 示例 详细 展示 了 它 的 工作 原理 。 


18.1 创建 一 个 数字 时 钟 


下 图 展示 了 一 个 运行 在 浏览 名 里 的 时 钟 。 所 有 无 天 的 浏览 名 窗 口 细节 ， 比 如 荣 单 、 工 具 栏 和 
滚动 条 都 设 有 显示 出 来 ， 这 样 我 们 就 能 把 注意 力 集中 在 代码 上 。 











16:30:52 








这 个 应 用 程序 的 关键 部 分 是 显示 界面 ， 它 里 面 的 时 间 会 每 秒 钟 更 新 一 次 。 从 Erlang 的 角度 看 ， 整 
个 浏览 需 就 是 一 个 进程 。 因 此 ， 为 了 把 时 钟 更 新 为 之 前 显示 的 值 ，Erlang 回 训 览 可 发 送 了 如 下 消息 : 


Browser ! #{ Cmd => fill div, id => clock, txt => <<"16:;30;52">> } 
我 们 在 浏览 器 里 载 和 人 了 一 张 HIML 网 页 ， 里 面 有 一 小 段 HTML : 


<div id='clock'> 











</dLV> 

浏览 器 收 到 fill div 后 就 把 它 转换 成 JavaScript 命 令 fill div({cmd:'fill div '， 
id:'clock'，txt:'16:30:52'}), 后 者 随即 把 指派 的 字符 串 作 为 内 容 填 充 到 div 中 。 

请 注意 包含 一 个 结构 的 Erlang 消 息 是 如 何 被 转换 成 等 价 的 J avaScriptw| 数 调 用 , 然后 在 浏览 及 
里 执行 的 。 扩展 这 个 系统 极其 简单。 你 要 做 的 就 是 编写 一 个 JavaScript 小 消 数 来 对 应 你 需要 处 理 的 
Erlang 消 县 。 

要 完成 这 张 图 ,需要 添加 启动 和 停止 时 钟 的 代码 。 把 所 有 东西 都 放 到 一 起 后 ，HTML 代 码 看 
起 来 就 像 这 样 : 

















websockets/clock1.html 


<script type="text/Javascript" src="./J9uery-1.7.1.min.js'"></script> 
<script type="text/Jjavascript" src=",/websock.ijs'"></script> 
<link rel="stylesheet" href="./ciockil.css" type="text/css'"> 
<body> 
<div id="clock"></diyv> 
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<button id="start" class="live button">start</bhutton> 
<button id="stop" class="live button">stop</buyutton> 
</body> 
<SCrILpt> 
$(document).ready (function()1 
connect("localhost", 2233, "clockl")., 
}); 


</script> 
首先 ， 载 人 了 两 个 JavaScript 库 和 一 个 样式 表 。cLockl.css 的 作用 是 给 时 钟 外 观 添加 样式 。 
接 下 来 是 一 些 构造 外 观 的 HTML。 最 后 ， 我 们 有 一 小 段 JavaScript， 它 会 在 网 页 载 人 后 运行 。 


注意 我们 在 所 有 示例 里 都 假定 你 了 解 一 些 jQuery 知识 。jQuery (http://jquery.com ) 是 一 个 极其 
流行 的 JavaScript 库 ， 它 简化 了 在 浏览 器 里 操作 对 象 的 工作 。 


websock.js 包 含 了 所 有 必需 的 代码 来 打开 WebSocket 和 连接 浏览 硕 DOM 对 象 到 Erlang。 它 会 
做 下 列 事情 。 

(1) 给 网 页 里 所 有 属于 Live_button 类 的 按钮 添加 点 击 处 理 旺 数 。 这 些 点 击 处 理 果 数 会 在 按 
钮 被 点 击 时 间 Erlang 发 送 消息 。 

(2) 尝试 启动 一 个 到 http://tlocalhost:2233 的 WebSocket 连 接 。 在 服务 器 端 会 有 一 个 新 分 
裂 出 的 进程 调用 ctLockl:start(Browser) 函数 。 所 有 这 些 都 是 通过 调用 JavaScript 酚 数 
connect("LocaLhost"，2233，"cLockl1") 实 现 的 。2233 这 个 数字 没有 什么 特别 的 含义 ， 任 何 
大 于 1023 的 未 使 用 端口 号 都 可 以 用 。 

现在 是 Erlang 人 代码: 








websockets/clock1.erl 


-module(clockl). 
-export([start/l1, current time/0]). 


start(Browser) -> 
Browser ! #{ cmd => fill div, id => clock, txt => current time() }, 
running (Browser). 


running(Browser) -> 
recelLVe 
{Browser, #{ CLICKed => << stop >>} } -> 

idle(Browser) 

after 1000 -> 
Browser ! #{ cmd => fill div, id => clock, txt => current time() }, 
running (Browser) 

end. 


idle(Browser) -> 
receive 
{Browser, #{clicked => <<"start'">>} } -> 
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running (Browser) 
end. 


current time() -> 
{Hour ,Min,Sec} = time(), 
list to binary(io lib:format{("~2.,2,0w:~2,2.,0wW:~2.2,0w", 
fHoyur,Min,Sec}))})., 


Erlang 代 码 从 start(Browser) 开 始 执行 。Browser 是 一 个 代表 浏览 器 的 进程 。 这 段 代码 的 第 
一 个 有 趣 之 处 如 下 : 

Browser ! #{ cmd => fill div, id => clock, txt => current time() } 

它 会 更 新 时 钟 的 显示 , 我 再 次 列 出 这 一 行 是 为 了 大 重 强调 。 编 辑 让 我 去 挥 它 , 没门 。 在 我 看 
来 这 是 非常 漂 腕 的 代码 。 夺 希望 让 浏览 右 做 点 什么 ， 就 问 它 发 送 一 个 消 上 县。 就 像 在 Erlang 里 一 样 。 
我 们 驯服 了 浏览 闪 ， 它 看 起 来 就 像 是 一 个 Erlang 进 程 。 太 棱 了 |! 

初始 化 之 后 ，clock1 会 调用 running/1。 如 果 收 到 一 个 {clicked => <<"stop">>} 消 息 ， 
就 会 调用 idle (Browser)。 否 则 ， 会 在 一 秒 钟 的 超时 到 期 后 向 浏览 带 发 送 一 个 更 新 时 钟 的 命令 ， 
然后 调用 上 自身 。 

idle/1 等 待 一 个 start 消 息 ， 然 后 调用 running/1。 


18.2 基本 交互 


接 下 来 的 示例 有 一 个 显示 数据 的 可 深 动 文本 区 域 和 一 个 输入 框 。 当 你 在 输入 框 里 输入 文本 并 
按 回 车 时 就 会 发 送 一 个 消息 给 训 览 名。 浏览 带 以 一 个 更 新 显示 内 容 的 消息 作为 啊 应 。 
































16:38:14 > hello 
16:38:16 > joe 





它 的 HIML 代 人 码 如 下 : 


websockets/interact1.html 

<script type="text/Javascript" src="./jquery-1.7.1.min.7s'"></script> 
<script type="text/javascript" src=",/websock.js'"></script> 

<tlink rel="stylesheet" href=",/interactl,css’" type="text/css'"> 
<body> 
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<h2>Interaction</h2> 
<div id="scroll"></div> 
<br> 
<input id="input" class="live input"></input> 
</body> 
<script> 
$({document).ready (function()1{ 
connect("localhost", 2233, "interact]1"); 
}); 
</script> 


然后 是 Erlang 代 人 三 : 


websockets/interact1.erl 


-module(interact1). 
-export([start/1]). 


start(Browser) -> running(Browser). 


running(Browser) -> 
receive 
{Browser, #{entry => <<"input">>, txt => Bin} } 
Time = clockl:current time(), 
Browser ! #1{cmd => append div, id => scroll, 
txt => list to binary([Time, " > ",， 


Bin, "<br>"])} 
end, 
running (Browser). 


它 的 工作 方式 类 似 于 时 钟 示 例 。 每 当 用 户 在 输入 框 里 按 下 回 车 键 时 , 输入 框 就 会 发 送 一 个 包 
含 输入 文本 的 消息 给 浏览 器 。 管 理 窗口 的 Erlang 进 程 接收 这 个 消息 ， 然 后 向 浏览 器 发 回 一 个 更 新 
显示 内 容 的 消息 。 











18.3 浏览 器 里 的 Erlang shell 
可 以 用 接口 模式 里 的 代码 制作 一 个 在 浏览 器 里 运行 的 Erlang shell。 


Erlang shell 


Starting Erlang shell: 

1 > 

1234567890 

2 > 
2323057227982592441500937982514410000 
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我 们 不 会 展示 全 部 代码 ， 因 为 它 和 交互 示例 的 代码 差不多 。 下 面 是 一 些 相 关 部 分 的 代码 : 


websockets/shell1.erl 


start(Browser) -> 
Browser ! #{cmd => append div, id => scroll, 
txt => <<"Starting Erlang shell:<br>">>}, 
BO = erl eval:new bindings(), 
running (Browser, BO, 1). 
running(Browser, BO, N) -> 
receive 
{Browser, #{entry => <<"inNnput">>}, txt => Bin}} -> 
{Value, Bl1} = string2value(binary to list(Bin), BO), 
BV = bf("~w > <font color='red'>~s</font><br>~p<br>", 
[IN, Bin, Value|]), 
Browser ! #{cmd => append div, id => scroll, txt => BV}, 
running (Browser, Bl1, N+1) 





end. 
难点 由 代码 里 解析 输入 字符 串 并 求 值 的 函数 完成 。 


websockets/shell1.erl 


string2valuyue{(Str, Bindings0) -> 
case erl scan:string(Str, ©) of 
{ok, Tokens, } -> 
case erl parse:parse exprs(Tokens) of 
{ok, Exprs} -> 
{value, Val, Bindingsl} = erl eval:exprs(Exprs, BindingsO), 
{Val, Bindingsl}; 
Other -> 
lio:format{"cannot parse:~p Reason=~p~n", {Tokens,Other]), 
{parse error, Bindings0} 


end; 
Other -> 
ijo:format("cannot tokenise:~p Reason=~p~n", [Str ,Otherl]) 
end . 





现在 就 有 了 一 个 在 浏览 器 里 运行 的 Erlang shell。 诚 然 ， 这 是 一 个 非常 初步 的 shell， 但 它 演示 
了 构建 更 复杂 shell 所 需 的 全 部 技巧 。 


18.4 创建 一 个 聊天 小 部 件 
在 本 音 接 下 来 的 部 分 里 ， 我 们 将 开发 一 个 IRC" 控 制程 序 。 这 个 程序 需要 一 个 聊天 小 部 件 。 





(DIRC 是 Internet Relay Chat ( 互联 网 中 继 聊天 ) 的 缩写 ， 它 以 客户 端 -服务 需 的 形式 进行 文本 消息 传输 。 一 一 译 者 注 
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聊天 
加 入 


susannah 


Joe joined the group ]oe 
susannah joined the group 
> hello 





创建 这 个 小 部 件 的 代码 如 下 : 


websockets/chat1.html 


<script type="text/javascript" src="./jquery-1.7.1.min.i7s"></script> 
<script type="text/Jjavascript" src="./websock.i;s'"></script> 
<Link rel="stylesheet" href=",/chati.css" type="text/css"> 


<body> 
<h2>Chat</h2> 
<input id="nick input"/> 
<button id="7oin">Join</button> 
<br/> 
<table> 
<tr> 
<td><div id="scroll"></div></td> 
<td><div id="Users"></div></td> 
</tr> 
<tr> 
<td colspan="2"> 
<input id="tell" class="live input"/> 
</td> 
</tr> 
</table> 
</body> 


<script> 
$(document).ready (functiont{)})t{ 
$("#Join").click(function()1{ 
var val = $("#nick input").val(); 
send json({'join’':val}); 
$("'#nick input").val(""), 
}); 
connect("localhost", 2233, "chatl"); 
上 


</script> 
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这 段 代码 和 前 面 儿 个 例子 中 的 大 致 相同 , 唯一 的 区 别 是 “Join ”按钮 的 用 法 。 我 们 想 让 “Join” 
按钮 在 点 击 后 执行 一 个 浏览 硕 本 地 操作 ， 而 不 是 回 控 制程 序 发 送 一 个 消息 。 下 面 的 代码 用 jQuery 
做 到 了 这 一 

$("#70in").click(function()t{ 
Var val = $("#nick input").val(); 
send json({'join':val}), 
$("#NICk iNput").val(""),; 

}) 

这 段 代码 给 “Join” 按 钮 挂 接 了 一 个 事件 处 理 器 。 点 击 “Join” 按 钮 ， 读 取 昵 称 输入 字段 ， 
并 回 Erlang 发 送 一 个 join 消息 ， 然 后 清除 输入 框 。 

i 我 们 必须 啊 应 两 类 消息 : 一 类 是 用 户 点 击 “Join” 按 钮 时 发 
送 的 join 消 息 ; 另 一 类 是 用 户 在 小 部 件 底 部 的 输入 字段 里 按 下 回 车 后 发 送 的 teLL 消 息 。 

要 测试 这 个 小 部 件 ， 可 以 使 用 如 下 代码 : 

















websockets/chat1 .erl 


-module(chat1). 
-export([start/1]). 


start(Browser) -> 
running(Browser, []). 


running(Browser, L) -> 
receive 
{Browser, #{]Oin => Who}} -> 
Browser ! #{cmd => append div ,1d => scroll, 
txt => list to binary([Who, " joined the groupin"])}, 
Ll = [Who,"<br>" |L], 
Browser ! #{cmd => fill div, id => Users, 
txt => list to binary(L1)}, 
running(Browser, L1); 
{Browser,#{entry => <<"tell">>, txt => Txt}} -> 
Browser ! #{cmd => append div, 1d => scroll, 
txt => list to binary([" > ", Txt, "<br>"])}, 
running(Browser, L), 
基 -> 
jo:format("chat received:~p~n", [X]) 
end, 
running (Browser, L). 


这 不 是 控制 了 RC 应 用 程序 的 真实 代码 ， 而 是 一 个 测试 程序 。 当 它 收 到 join 消息 时 ， 滚 动 区 
域 就 会 更 新 ， 用 户 div 里 的 用 户 名 单 也 会 发 生变 化 。 当 它 收 到 tell 消 息 时 ， 只 有 深 动 区 域 会 发 生 
变化 。 
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18.5 简化 版 IRC 


上 一 市 里 的 聊天 小 部 件 可 以 轻松 扩展 成 一 个 更 真实 的 聊天 程序 。 为 做 到 这 一 


天 小 部 件 的 代码 修改 如 下 : 


websockets/chat2.html 


<script type="text/javascript" src="./jquery-1.7.1.min.i7s"></script> 
<script type="text/Javascript" src="./websock.i;s'"></script> 
<Link rel="stylesheet" href=",/chati.css" type="text/css'"> 


<body> 
<h2>Chat</h2> 
<div id="idle"> 
<input id="nick input"/> 
<button id="Join">Join</button> 
<br/> 
</div> 


<div id="running"> 
<table> 
<tr> 
<td><div id="scroll"></div></td> 
<td><div id="users"></div></td> 
</tr> 
<tr> 
<td colspan="2"> 
<input id="teil" class="live input"/><br/> 
<button class="live button" id="lieave">Leave</button> 
</td> 
</tr> 
</table> 
</div> 
</body> 


<script> 
$(document).ready (function()1{ 
$("#running").hide(); 
$("#]joOinNn").click(function()t1 
Var val = $("#nick input").val(); 
send json({'join':val}); 
$("#n1ick input").val(""),; 
}); 


connect ("localhost", 2233, "chat2"): 
上 


function hide gdIv(oi 
$("#" + 0.id).hide(); 


点 , 我 们 将 把 聊 
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} 


function Show div(o)t{ 
${('"#" + 0.1id).showt(),; 
} 


</script> 

这 上 段 代码 有 两 个 主要 的 div， 分别 是 idle (空间 ) 和 running (运行 )。 它 们 中 有 一 个 隐藏 ， 
另 一 个 显示 。 当 用 户 点 击 “Join” 按 钮 时 会 生成 一 个 发 送 到 IRC 服 务 需 的 请 求 来 加 入 聊天 。 如 果 
用 户 名 未 被 使 用 ， 服 务 需 就 会 回复 一 个 欢迎 消息 ， 然 后 聊天 处 理 程 序 会 隐藏 idLediv 并 显示 
runningdiv。 对 应 的 Erlang 代 人 码 如 下 : 








websockets/chat2.erl 


-module (chat2). 
-export({start/1]1). 


start(Browser) -> 
idle(Browser). 


ldile(Browser) -> 
receive 
{Browser, #{j0oin => Who}} -> 
irc ! {join, self(), Who}, 
idle(Browser); 
{irc, welcome, Who} -> 
Browser ! #{cmd => hide div, id => idle}, 
Browser ! #{cmd => Show div, id => running}, 
running (Browser, Who),; 
XX -> 
io:format("chat idle received:~p~n", {X}), 
idle(Browser) 
end. 


running(Browser, Who) -> 
receive 

{Browser,#{entry => <<"tell'">>, txt => Txt}} -> 
irc ! {broadcast, Who, Txt}, 
running (Browser, Who),; 

{Browser,#{clicked => <<"Leave'">>}} -> 
irc ! {leave, Who}, 
Browser ! #{cmd => hide div, 1id => running}, 
Browser ! #{cmd => Show div, id => idle}, 
idle(Browser),; 

{irc, scroll, BinNn}y -> 
Browser ! #{cmd => append div, id => scroll, txt => Bin}, 
running (Browser, Who); 
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{irc, groups, Bin} -> 
Browser ! #{cmd => fill div, id => users, txt => Bin}, 
running(Browser, Who); 
X -> 
io:format( chat running received:~p~n",[X]), 
running (Browser, Who) 
end. 


在 运行 状态 时 ， 聊 天 控制 程序 可 以 接收 四 类 消息 。 其 中 两 类 来 自 浏 览 姻 : 说 话 (tell ) 消息 
是 在 用 户 把 消息 输入 到 聊天 输入 字段 之 后 收 到 的 ; 离开 ( leave ) 消息 是 在 用 户 点 击 “Leave” 按 
钮 之 后 收 到 的 。 这 些 消息 会 被 中 继 到 IRC 服 务 袁 上 ， 如 果 是 离开 消息 ， 就 会 有 后 续 的 消息 发 送 给 
浏览 需 来 隐藏 running div 并 显示 idle div， 这 样 就 回 到 初始 状态 了 

其 余 两 类 消息 来 日 IRC 服 务 器 ， 它 们 会 让 控制 程 ) 更 新 深 动 区 域 或 者 用 户 名 单 

IRC 控 制程 序 的 代码 非常 简单 。 

















websockets/irc.erl 


-module(irc). 
-export([start/0]). 


start() -> 
register(irc, spawn(fun() -> start1() end)). 


start1() -> 
process flag(trap exit, true), 
Loop([]). 


loop(L) -> 
receive 
{join, Pid, Who} -> 
case lists:keysearch(Who,1,L) of 
false -> 
Ll = LL ++ [{Who,Pid}], 
Pid ! {irc, welcome, Who}, 
Msg = [Who, <<" Jjoined the chat<br>">>|], 
broadcast(L1, scroll, list to binary(Msg)), 
broadcast(L1, groups, list users(L]1)), 
loop(L1),， 
{value, } -> 
Pid ! {irc, error, <<'"Name taken'">>}, 
loop(L) 
end; 
{leave, Who} -> 
case lists:keysearch(Who,1,L) of 
false -> 
loop(L); 
{value, {Who,Pid}} -> 
Ll1= | -- [{Who,Pid}], 
Msg = [Who, <<" left the chat<br>">>], 
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broadcast(L1, scroll, list to binary(Msg)), 
broadcast(L1, groups, list users(L]1)), 
loop(L1) 
end: 
{broadcast, Who, Txt} -> 
broadcast(L, scroll, 
list to binary([" > ", Who, " >> ", Txt, "<br>"])), 
loop (L); 
X -> 
ijo:format("irc:received:~p~n",[X]), 
loop(L) 
end ， 
broadcast(L，Tag，B) -> 
[Pid ! {irc, Tag, B} || {_,Pid} <- L]. 


list users(L) -> 
L1 = [[Who, "<br>"] || {Who, }<- L], 
list to binary(L1). 
这 段 代码 需要 解释 一 下 。 如 果 IRC 服 务 咒 收 到 一 个 加 入 消息 而 用 户 名 未 被 使 用 ， 它 就 会 广播 
一 个 新 的 用 户 名 单 给 所 有 已 连接 用 户 , 同时 广播 一 个 加 入 消息 给 所 有 已 连接 用 户 的 滚动 区 域 。 如 
采 收 到 的 是 离开 消 奶 , 它 就 会 把 该 用 户 移 出 当前 用 户 名 单 , 并 把 这 个 信息 广播 给 所 有 已 连接 用 户 。 
要 在 一 个 分 布 式 系统 里 运行 它 ， 就 需要 让 一 台 机 需 运 行 耻 C 服 务 需 。 其 他 所 有 机 融 都 必须 知 
道 服 务 硕 运行 机 硕 的 王 地 址 或 主机 名 。 举 个 例子 ， 如 末了 RC 服 务 硕 运行 机 硕 的 卫 地 址 是 
AAA.BBB.CCC.DDD， 那 么 其 他 所 有 机 需 都 应 该 请 求 URL 为 http://AAA.BBB.CCC.DDD:2233/ 
chat2.htmL (2233 端 口 是 默 认 的 端口 号 ) 的 网 页 。 





18.6 ”浏览 器 里 的 图 形 


到 目前 为 止 , 我 们 只 在 浏览 妖 里 见 过 文字 ,一旦 把 图 形 对 象 引 入 浏览 器 ,一 个 全 新 的 世界 就 
出 现 了 。 要 实现 它 其 实 很 简单 ， 因 为 可 以 使 用 内 建 于 现代 浏览 器 里 的 可 伸缩 矢量 图 形 (Scalable 
Vector Graphics， 人 简称 SVG ) 格式 。 


draw rectangle 
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以 下 是 我 们 打算 做 的 。 在 浏览 器 里 创建 一 张 SVG 画布 , 并 在 下 方 放置 一 个 按钮 。 点 击 按钮 后 
会 给 Erlang 发 送 一 个 消息 。Erlang 回 复 一 个 命令 ， 计 浏览 絮 给 SVG 男 布 添 加 一 个 矩形 。 上 面 的 屏 
幕 截 图 展示 了 点 击 五 次 “draw rectangle” 按 钮 后 小 部 件 的 样子 。 实 现 它 的 Erlang 代 码 如 下 : 


websockets/svg1.erl 


-module(svgl). 
-export([start/1]). 


start(Browser) -> 
Browser ! #{cmd => add canvas, tag => Svg, width => 180, height => 120}, 
running (Browser, 10, 10). 


running(Browser, X, Y) -> 
receive 
{Browser,#{clicked => <<"gdraw rectangle">>}} -> 
Browser ! #{cmd => add svg thing, type => rect， 
rx => 3, ry => 3, x => X, y => Y, 
width => 100,height => 50, 
stroke => blue,'stroke-width' => 2， 
fill => red}, 
running (Browser, X+10, Y+10) 
end. 


这 段 Erlang 代 码 向 浏览 器 发 送 两 类 消息 : [{cmd,add canvas}，... 和 [{cmd,add svg 
thingy，:...]。 因 此 ， 必 须 在 浏览 套 载 人 的 JavaScript 里 提供 这 些 命令 的 定义 。 


websockets/svg1.html 


<script type="text/Jjavascript" src="./jquery-1.7.1.min.js'"></script> 
<script type="text/javascript" src="./websock.js"></script> 
<LInKk rel="stylesheet" href="./svgil.css" type="text/css"> 
<body> 

<div id="svg"></div> 

<button id="start" class="live button">draw rectangle</button> 
</body> 


<script> 

$(document) .ready (function()})t 
connect("localhost", 2233, "svg1"); 
站 


var canvas; 
var svg ns='http://www.w3.0rg/2000/svg’'; 


function add canvas{(o){ 
canvas = document.createElementNS(svg ns, 'svg'); 
canvas.setAttribute("width", 0o.width),; 
canvas.setAttribute("height", o.height ); 
canvas.setAttribute("style", "background-color:#eeffbb"),; 


$('#'+0.tag) ,append(canvas ) ; 
} 


function add svg thing(o){ 
var 0bj = document ,createEtementNS(Svg ns, o0.type); 
for(key In Di 
var val = 0[Key] 
obj .setAttributeNS(null, key, val); 
上 
canvas.appendChild(ob]j); 
上 





</script> 18 
有 了 这 两 个 函数 ,就 可 以 开始 使 用 SVG 图 形 了 。, 请 注音， 当 癌 浏览 各 发送 一 个 他 令 来 绘制 矩 





形 时 ,这 个 命令 包含 了 许多 参数 。rx 和 ry 等 属 性 的 作用 是 生成 矩形 的 圆 角 。 这 些 属性 的 完整 清单 
可 以 在 W3C 规 范 ? 里 找到 。 


18.7 ”浏览 器 -服务 器 协议 


浏览 硕 - 服 务 需 协议 极其 简单 。 它 使 用 es 输 JSON 消 息 ， 这 种 方式 对 Erlang 和 
JavaScript 都 非常 合适 ， 让 建立 浏览 吉 到 Erlang 的 接口 变 得 十 分 简单 。 





18.7.1 从 Erlang 发 送 消息 到 浏览 器 

要 改变 浏览 如 里 的 内 容 , 可 以 从 Erlang 发 送 一 个 消息 到 浏览 右 。 假 设 浏览 硕 里 有 一 个 div， 它 
的 声明 如 下 : 

<div id="10123"></div> 

要 把 这 个 div 的 内 容 改 成 字符 串 abc，Erlang 可 以 癌 连 接 浏 览 瘟 的 WebSocket 发 送 以 下 JSON 
消息 : 

[{cmd: 'filt div', id:'id123', txt:'abc'}] 

当 浏 览 器 收 到 来 自 WebSocket 的 消息 时 ， 会 激活 webserver.js 里 名 为 onMessage 的 回调 函 
数 。 调 用 它 的 代码 如 下 : 


websocket = new WebSocket (wsUri): 





websocket.onmessage = onMessage,; 


这 个 回调 咀 数 的 定义 如 下 : 


function onMessage (evt) { 
Var json = JSON.parse(evt. data), 


GD http://www.w3.o0org/TR/SVG/ 
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do_cmds (]j son); 


} 


function do cmds (objs)t{ 
for(var i = 0; i < objs.length,; i++){ 
var 0 = objs[i]; 


if(eval ("typeof("+o.cmd+")") == "function")t 
eval(o.cmd + "(0)"); 
} else { 
alert("bad command: "+0.cmd); 
}; 
}， 
} 
do_cmds (objs) 期 望 收 到 一 列 以 下 形式 的 命令 : 
[{cmd:commandl, .i oo }, 
{cmd:command2, ,i vu! }, 
{cmd :commandN，,,,:,，，，，,，,,:,，, }] 





列表 里 的 每 个 命令 都 是 一 个 JavaScript 对 象 ， 它 必须 包含 一 个 名 为 cmd 的 键 。 对 列表 里 的 每 个 
对 象 x， 系 统 虱 会 检查 是 否 存在 名 为 x.cmd 的 函数 。 如 果 存 在 ， 它 就 会 调用 x.cmd(x)。 因 此 ， 
{cmd: 'fill div',，id:'id123'，txt:'abc'} 会 导致 系统 调用 .: 














fill div( {cmd: 'fill oiv', id:'id123', txt:'abc’'}) 

这 种 编码 和 执行 命令 的 方式 能 够 轻松 扩展 ， 这 样 就 能 在 必要 时 给 接口 添加 更 多 的 命令 。 
18.7.2 ”从 浏览 器 到 Erlang 的 消息 

当 我 们 在 浏览 需 里 点 击 某 个 按钮 时 ， 就 会 执行 这 样 的 命令 : 

send json({ CLICKed :txt})); 


send_ json(x) 把 参数 x 编 码 成 JSON 数 据 类 型 ， 然 后 把 它 写 人 WebSocket。 这 个 消息 在 
websocket .ert 里 接收 并 转换 成 一 个 结构 ， 然 后 发 送 给 管理 WebSocket 的 控制 进程 。 

我 们 已 经 了 解 了 如 何 将 消息 传递 的 概念 延伸 到 Erlang 之 外 ,以 及 如 何 利 用 消息 传递 来 直接 控 
制 浏 览 器 。 从 Erlang 程 序 员 的 角度 看 ， 这 个 世界 现在 是 一 个 秩序 井然 的 空间 ， 所 有 的 对 和 象 都 能 响 
应 Erlang 消 息 。 我 们 并 不 是 在 Erlang 里 做 一 套 , 在 Erlang 外 做 另 一 套 。 这 为 程序 增加 了 很 强 的 秩序 
感 和 统一 性 ， 使 这 个 复杂 的 世界 看 起 来 更 简单 了 。Web 浏 览 需 自然 是 一 个 相当 复杂 的 对 象 ， 但 是 
通过 让 它 以 可 预测 的 方式 啊 应 少量 消息 ,就 能 轻松 控制 并 驾驭 这 种 复杂 性 ,从 而 构建 强大 的 应 用 
程序 。 

在 这 一 章 里 ，Web 浏 览 器 看 起 来 就 像 一 个 Erlang 进 程 。 我 们 可 以 向 浏览 器 发 送 消息 来 让 它 做 
许多 事 , 同时 当 浏 览 副 里 发 生 了 某 些 状况 时 , 我 们 也 能 收 到 消息 。 在 Erlang 里 用 映射 组 代表 消息 ， 
它们 会 被 编码 成 JSON 消 息 ， 然 后 在 浏览 需 里 体现 为 JavaScript 对 象 。 消 息 的 表现 形式 在 Erlang 和 
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JavaScript 里 只 有 微小 的 概念 差异 , 这 就 简化 了 编程 工作 , 因为 不 必 在 改变 表现 形式 的 细节 上 过 于 


费心 。 
现在 我 们 将 转 回 另 一 个 主题 。 接 下 来 的 两 章 涉及 存储 大 容量 的 数据 。 其 中 第 19 草 详细 介绍 了 
底层 存储 模块 ets 和 dets。 第 20 章 详细 介绍 了 Erlang 的 mnesia 数 据 库 , 它 是 用 ets 和 dets 实 现 的 。 





18.8 练习 


(1) shel1l1.erl 里 启动 的 进程 不 够 完善 。 如 果 它 表演 了 , Web 应 用 程序 就 会 锁定 并 无 法 运行 。 
给 这 个 应 用 程序 添加 错误 恢复 代码 。 添 加 历史 命令 重 放 的 功能 。 

(2) 阅读 websockets ,js 里 的 代码 ， 仔 细 追 踪 浏 览 锅 里 革 个 活动 按钮 被 点 击 后 发 生 的 事 。 跟 上 
着 代码 从 JavaScript 到 WebSocket， 再 从 WebSocket 到 Erlang。 点 击 按钮 后 生成 的 消息 是 如 何 找到 相 
应 的 Erlang 控 制 进程 的 ? 

(3) 简化 版 耻 C 程 序 是 一 个 功能 完备 的 聊天 程序 。 试 春运 行 它 并 检查 它 的 功能 是 否 正 稼 。 你 
可 能 会 发 现 防火 墙 之 类 的 因 系 阻止 它 访 问 服务 如 ,让 它 无 法 正常 工作 。 如 有 果 是 这 样 ， 就 进行 调查 
并 看 看 能 否 开 放 防 火 墙 。 尝 试 找到 真正 的 IRC 协 议 规范 ， 你 会 发 现 它 比 这 里 的 版 本 长 很 多 。 为 什 
么 会 这 样 ? 用 某 种 用 户 吴 份 验证 系统 来 扩展 这 个 IRC 系 统 。 

(4) IRC 程 序 使 用 了 一 台中 央 服 务 硕 。 能 否 修 改 这 个 程序 ， 让 它 用 点 对 点 网 络 取代 中 央 服 务 
大 ? 能 否 给 聊天 客户 端 添 加 SVG 图 形 ， 或 者 用 HTMLS 里 的 音频 接口 发 送 和 接收 声音 数据 ? 
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ets 和 dets 是 两 个 系统 模块 , 可 以 用 来 高 效 存 储 海量 的 Erlang 数 据 。 ETS 是 Erlang Term Storage 
( Erlang 数 据 存储 ) 的 缩写 ，DETS 则 是 Disk ETS ( 磁盘 ETS ) 的 缩写 。 

ETS 和 DETS 执 行 的 任务 基本 相同 : 它们 提供 大 型 的 键 - 值 查询 表 。ETS 向 驻 内 存 ，DETS 则 
常 驻 磁 盘 。ETS 是 相当 高 效 的 : 可 以 用 它 存储 海量 的 数据 ( 只 要 有 足够 的 内 存 )， 执 行 查 找 的 时 
间 也 是 恒定 的 (在 某 些 情况 下 是 对 数 时 间 )。DETS 提 供 了 几乎 和 ETS 一 样 的 接口 ， 但 它 会 把 表 保 
存在 磁盘 上 。 因 为 DETS 使 用 磁盘 存储 ， 所 以 它 远 远 慢 于 ETS， 但 是 运行 时 的 内 存 占用 也 会 小 很 
多 。 男 外 ，ETS 和 DETS 表 可 以 被 多 个 进程 共享 ， 这 就 让 跨 进程 的 公共 数据 访问 变 得 非常 高 效 。 

ETS 和 DETS 表 是 把 键 和 值 关 联 到 一 起 的 数据 结构 。 最 常用 的 表 操 作 是 插入 和 查找 。ETS 或 
DETS 表 其 实 就 是 Erlang 元 组 的 集合 。 

ETS 表 里 的 数据 保存 在 内 存 里 ， 它 们 是 多 失 的 。 当 ETS 表 被 丢弃 或 者 控制 它 的 Erlang 进 程 终 
止 时 ， 这 些 数 据 就 会 被 删除 。 保 存在 DETS 表 里 的 数据 是 非 易 失 的 ， 即 使 整个 系统 崩溃 也 能 留存 
下 来 。DETS 表 在 打开 时 会 进行 一 致 性 检查 ， 如 果 发 现 有 损坏 ， 系 统 就 会 尝试 修复 它 (这 可 能 会 
花费 很 长 时 间 ， 因 为 表 里 的 所 有 数据 都 要 检查 )。 

这 应 该 能 恢复 表 里 的 所 有 数据 ， 但 如 果 表 里 的 最 后 一 项 是 在 系统 骨 演 时 生成 的 ， 就 可 能 会 
天 尖 。 

ETS 表 广泛 应 用 于 那些 必须 以 高 效 方式 操作 大 量 数据 的 应 用 程序 ， 以 及 用 非 破坏 性 赋值 和 
“ 纯 ”Erlang 数 据 结 构 编程 的 开销 过 大 之 时 。 

ETS 表 看 上 去 像 是 用 Erlang 实 现 的 ， 但 事实 上 它们 是 在 底层 的 运行 时 系统 里 实现 的 ， 有 着 不 
同 于 普通 Erlang 对 象 的 性 能 特点 。 特 别 需 要 指出 的 是 ，ETS 表 没有 垃圾 收集 机 制 ， 这 就 意味 着 即 
使 ETS 表 极其 巨大 也 不 会 有 垃圾 收集 的 负担 。 不 过 ， 创 建 或 访问 ETS 对 象 仍然 会 带 来 少许 开销 。 


19.1 表 的 类 型 


ETS 和 DETS 表 保存 的 是 元 组 。 元 组 里 的 某 一 个 元 系 ( 默认 是 第 一 个 ) 被 称 为 该 表 的 键 。 通 
过 键 来 癌 表 里 插入 和 提取 元 组 。 当 我 们 问 表 里 插入 一 个 元 组 时 会 发 生 什么 , 取决 于 表 的 类 型 和 键 
的 值 。 一 些 表 被 称 为 异 键 表 ( set ), 它们 要 求 表 里 所 有 的 键 都 是 唯一 的 。 另 一 些 被 称 为 同 键 表 ( bag )， 
它们 允许 多 个 元 素 拥有 相同 的 键 。 
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选择 正确 类 型 的 表 对 应 用 程序 的 性 能 意义 重大 。 
基本 的 表 类 型 ( 异 键 表 和 同 键 表 ) 各 有 两 个 变种 ,它们 共同 构成 四 种 表 类 型 : 寞 键 、 有 序 异 
键 ( ordered set )、 同 键 和 副本 同 键 ( duplicate bag )。 在 异 键 表 里 ， 各 个 元 组 里 的 键 都 必须 是 独 一 
无 二 的 。 在 有 序 异 键 表 里 ， 元 组 会 被 排序 。 在 同 键 表 里 可 以 有 不 止 一 个 元 组 拥有 相同 的 键 , 但 是 
不 能 有 两 个 完全 相同 的 元 组 。 在 副本 同 键 表 里 可 以 有 多 个 元 组 拥有 相同 的 键 ， 而 且 在 同一 张 表 里 
可 以 存在 多 个 相同 的 元 组 。 
ETS 和 DETS 表 有 四 种 基本 操作 。 
口 创建 一 个 新 表 或 打开 现 有 的 表 
用 ets:new 或 dets:open file 实现。 
口 向 表 里 插入 一 个 或 多 个 元 组 
这 里 要 调用 insert(TableId, X)， 其 中 Xx 是 一 个 元 组 或 元 组 列表 。insert 在 ETS 和 DETS 
里 有 痢 相 同 的 参数 和 工作 方式 。 
口 在 表 里 查找 某 个 元 组 
这 里 要 调用 Lookup (TabLeID，Key) 。 得 到 的 结果 是 一 个 匹配 Key 的 元 组 列表 。Lookup 
在 ETS 和 DETS 里 都 有 定义 。 
Lookup 的 返回 值 始 终 是 一 个 元 组 列表 , 这 样 就 能 对 异 键 表 和 同 键 表 使 用 同一 个 查找 机 数 。 
如 条 表 的 类 型 是 同 键 ， 那 么 多 个 元 组 可 以 拥有 相同 的 键 。 如 采 表 的 类 型 是 异 键 ， 那 么 查 
找 成 功 后 的 列表 里 只 会 有 一 个 元 素 。 我 们 将 在 下 一 节 介 绍 表 的 类 型 。 
如 条 表 里 没 有 任何 元 组 拥有 所 需 的 键 ， 就 会 返回 一 个 空 列表 。 
口 丢弃 某 个 表 
用 完 革 个 表 后 可 以 告知 系统 ， 方法 是 调用 dets:ctLose(TabteId) 或 ets:detLete 
(TabLeId ) 。 
可 以 用 下 面 这 个 小 测试 程序 来 演示 它们 是 如 何 工作 的 : 


















































ets test.erl 


-module(ets test). 
-export([start/0]). 


start() -> 
lists:foreach(fun test ets/1, 
[set, ordered set, bag, duplicate bag]). 


test ets(Mode) -> 
Tableld = ets:new(test, [Mode]), 
ets:insert(TablelId, {a,1}), 
ets:insert(TableIld, {b,2}), 
ets:insert(Tableld, {a,1}), 
ets:insert(Tableld, {a,3}), 
List = ets:tab2list(Tableld), 
jo:format("~-13w => ~p~n", [Mode, List]), 
ets:delete(TablelId). 
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这 个 程序 会 为 四 种 模式 各 创建 一 个 ETS 表 , 然后 向 表 内 插入 {a,1}、{b,2}、t{a,1} 和 {a,3}。 
然后 调用 tab21list， 它 会 把 整个 表 转 换 成 一 个 列表 并 打印 出 来 。 
运行 这 个 程序 会 得 到 以 下 输出 : 


了 > ets test:start(). 


set => [{b,2},1{a,3}] 
ordered set => [{a,3},1{b,2}] 
bag => [{b,2},1a,1},1a,3}] 


duplicate bag => [{b,2},{a,1},1{a,1},1{a,3}] 


在 开 键 型 的 表 里 ,， 每 个 键 虱 只 能 出 现 一 次 。 如 末 先 癌 表 内 插入 元 组 {a,1} 然 后 再 插入 {a,3}， 
那么 最 终 值 将 是 {a,3}。 寞 键 表 和 有 序 寞 键 表 的 唯一 区 别 是 有 序 寞 键 表 里 的 元 系 会 根据 它们 的 键 
排序 。 用 tab21List 把 表 转 换 成 列表 之 后 就 能 看 到 这 一 顺序 了 。 

同 键 型 的 表 可 以 有 多 个 相同 的 键 。 举 个 例子 ， 当 我 们 先 插入 {a,1} 再 插入 {a,3} 时 ， 同 键 表 
就 会 同时 包含 这 两 个 元 组 ， 而 不 仪 仪 是 后 一 个 。 副本 同 键 表 里 允 许 有 多 个 完全 相同 的 元 组 ,这 样 
当 连 续 捅 人 两 次 {fa,1} 时 ， 表 里 就 会 有 两 个 相同 的 {a,1} 元 组 ， 而 普通 同 键 表 里 只 会 留 下 一 个 。 


19.2 ”影响 ETS 表 效 率 的 因素 


ETS 表 在 内 部 是 用 散 列 表 表示 的 ( 除了 有 序 寞 键 表 ， 它 是 用 平衡 二 叉 树 表示 的 )。 这 就 意味 
着 使 用 寞 键 表 会 汕 来 少许 空间 开销 , 而 使 用 有 序 异 键 表 会 沉 来 时 间 开 销 。 插入 寞 键 表 所 需 的 时 间 
是 恒定 的 ， 而 插入 有 序 异 键 表 所 需 的 时 间 与 表 内 条 目 数 量 的 对 数 成 比例 。 

当 你 在 异 键 表 和 有 序 异 键 表 之 间 进 行 选择 时 , 应 该 考虑 构建 表 之 后 会 拿 它 做 什么 。 如 果 想 要 
一 个 排 过 序 的 表 ， 就 应 该 使 用 有 序 异 键 表 。 

使 用 同 键 表 的 代价 比 使 用 副本 同 键 表 更 高 , 因为 每 次 插入 时 都 需要 与 所 有 拥有 相同 键 的 元 又 
比较 是 否 相 等 。 如 东 有 大 量 元 组 都 拥有 同一 个 键 ， 这 么 做 就 会 很 低 效 。 

ETS 表 保存 在 一 个 单独 的 存储 区 域 里 ， 与 正常 的 进程 内 存 无 关 。 可 以 认为 ETS 表 归 创建 它 的 
进程 所 有 ， 当 这 个 进程 挂 了 或 者 调用 ets : detLete 时 ， 表 就 会 被 删除 。ETS 表 不 会 进行 垃圾 收集 ， 
这 就 意味 着 即使 表 里 存 储 了 海量 的 数据 也 不 会 产生 垃圾 收集 的 开销 。 

当 一 个 元 组 被 插入 ETS 表 时 ,所 有 代表 这 个 元 组 的 数据 结构 都 会 从 进程 的 栈 复制 到 ETS 表 里 。 
当 你 对 表 执 行 查 询 操作 时 ， 找 到 的 元 组 会 从 ETS 表 复制 到 进程 的 栈 上 。 

所 有 的 数据 结构 部 是 如 此 , 除了 大 型 的 二 进 制 数 据 。 这些 二 进 制 型 会 存储 在 它们 目 己 的 堆 外 
存储 区 域 里 。 这 个 区 域 可 以 被 多 个 进程 和 ETS 表 共有 日， 各 个 二 进 制 型 则 由 一 个 引用 计数 垃圾 收集 
俯 管 理 ， 它 会 记录 有 多 少 个 不 同 的 进程 和 ETS 表 在 使 用 这 个 二 进 制 型 。 如 果 某 个 特定 二 进 制 型 的 
进程 和 表 使 用 计数 降 至 零 ， 那 么 这 个 二 进 制 型 的 存储 区 域 就 可 以 被 回收 。 


















































所 有 这 些 听 上 去 可 能 比较 复杂 , 但 最 终 的 结论 是 : 在 进程 间 传 递 包含 大 型 二 进 制 数据 的 消 县 
是 非常 高 效 的 ， 回 ETS 表 插 和 人 包含 二 进 制 型 的 元 组 也 非 稼 高 效 。 一 个 不 错 的 经 验 法 则 是 尽 可 能 多 





用 二 进 制 型 来 表示 字符 串 和 大 块 的 无 类 型 内 存 。 
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19.3 创建 一 个 ETS 表 


创建 ETS 表 的 方法 是 调用 ets :new。 创 建 表 的 进程 被 称 为 该 表 的 主管 。 创 建 表 时 所 设置 的 一 
组 选项 在 以 后 是 无 法 更 改 的 。 如 末 主 管 进程 挂 了 ， 表 的 空间 就 会 被 目 动 释放 。 你 可 以 调用 
ets :delete 来 删除 表 。 

ets :new 的 参数 如 下 。 

-Spec ets:new(Name, [Opt]) -> Tableld 

其 中 ，Name 是 一 个 原子 。[0pt] 是 一 列 选项 ， 源 于 下 面 这 些 参数 。 

® set | ordered set | bag | duplicate bag 

创建 一 个 指定 类 型 的 ETS 表 (我们 之 前 讨论 过 )。 
@ private 
创建 一 个 私有 表 ， 只 有 主管 进程 才能 谈 取 和 写 人 它 。 
@ public 
创建 一 个 公共 表 ， 任 何 知 道 此 表 标 识 符 的 进程 都 能 恋 取 和 写 入 它 。 
@ protected 
创建 一 个 受 保 护 表 ， 任 何 知 道 此 表 标 识 符 的 进程 都 能 恋 取 它 ， 但 只 有 主管 进程 才能 写 
Ce 
@ named table 
如 末 设 置 了 此 选项 ，Name 束 可 以 被 用 于 后 续 的 表 操 作 。 

© {keypos, K} 

用 K 作 为 键 的 位 置 。 通常 键 的 位 置 是 1。 基 本 上 唯一 需要 使 用 这 个 选项 的 场合 是 保存 Erlang 
记录 ( 它 其 实 是 元 组 的 为 一 种 形式 )， 并且 记 录 的 第 一 个 元 素 包 含 记录 名 的 时 候 。 























注意 不 使 用 任何 选项 打开 一 个 ETS 表 就 相当 于 用 [set,protected, {keypos,1}] 选 项 打开 它 。 


本 童 里 的 所 有 代码 都 使 用 protectedETS 表 。 受 保护 表 特 别 有 用 ， 因 为 它们 能 实现 几乎 零 成 本 
的 数据 共 诗 。 所 有 知道 此 表 标 识 符 的 本 地 进程 部 能 读 取 数据 ， 但 只 有 一 个 进程 能 修改 表 里 的 数据 。 





类 似 黑 板 的 ETS 表 
受 保护 表 提 供 了 一 种 “黑板 系统 ”样式 。 你 可 以 把 受 保护 表 想 象 成 一 种 有 名 字 的 黑板 。 
任何 知道 黑板 名 的 人 都 可 以 阅读 它 ， 但 只 有 所 有 者 才能 在 黑板 上 写字 。 
注意 : 用 public 模 式 打 开 的 ETS 表 可 以 被 任何 知道 表 名 的 进程 读 写 。 在 这 种 情况 下 ， 用 
户 必 须 确 保 以 互 不 冲突 的 方式 执行 表 的 读 取 和 写 入 操作 。 


19.4 ”ETS 示例 程序 
本 市 里 的 示例 是 关于 生成 三 字母 组 合 (trigram ) 的 。 这 是 一 个 不 错 的 “表演 性 ”程序 ， 它 演 
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示 了 ETS 表 的 威力 。 

我 们 的 目标 是 编写 一 个 启发 式 程序 ， 让 它 尝 试 预测 某 个 给 定 字符 串 是 否 是 英语 单词 。 

为 了 预测 某 个 随机 字母 序列 是 否 是 英语 单词 ， 我 们 将 分 析 这 个 词 里 出 现 了 哪些 三 字母 组 合 。 
三 字母 组 合 是 由 三 个 连续 字母 组 成 的 序列 ， 但 不 是 任何 三 字母 序列 都 会 在 正确 的 英语 单词 里 出 
现 。 举 个 例子 ， 任 何 英语 单词 里 都 不 会 出 现 agj 和 rwb 这 样 的 三 字母 组 合 。 因 此 ， 为 了 测试 某 个 字 
符 串 是 否 是 英语 单词 , 要 做 的 就 是 将 字符 串 里 所 有 连续 的 三 个 字母 序列 与 一 批 三 字母 组 合 进行 对 
比 测试 ， 后 者 是 用 一 个 大 型 英语 单词 集合 生成 的 。 

程序 做 的 第 一 件 事 是 用 一 个 非常 大 的 单词 集合 来 计算 喘 语 中 所 有 的 三 学 母 组 合 。 要 做 到 这 一 
点 ， 我 们 使 用 ETS 异 键 表 。 这 个 决定 是 根据 ETS 异 键 表 、 有 序 异 键 表 和 sets 模 块 所 提供 的 “ 纯 ” 
Erlang 异 键 表 之 间 的 一 组 相对 性 能 测量 结果 得 出 的 。 

我 们 将 在 接 下 来 的 几 节 里 做 这 些 事 。 

(1) 制作 一 个 壳 历 英语 里 所 有 三 字母 组 合 的 迭代 洱 数 。 这 将 大 大 人 简化 疝 不 同 表 类 型 插入 三 字 
母 组 合 的 编码 工作 。 

(2) 创建 set 和 ordered set 类 型 的 ETS 表 来 存放 所 有 这 些 三 字母 组 合 。 男 外 再 创建 一 个 异 键 
表 来 存放 这 些 三 字母 组 合 。 

(3) 测量 创建 这 几 种 表 所 需 的 时 间 。 

(4) 测量 访问 这 几 种 表 所 需 的 时 间 。 

(5) 根据 测量 结果 选择 最 佳 的 方法 ， 并 为 它 编写 访问 函数 。 

所 有 代码 都 在 Lib trigrams 里 。 我 们 将 分 几 节 呈现 它 ， 同 时 省 略 一 些 细节 。 别 担心 ， 完 整 
的 代码 在 本 书 主页 "所 提供 的 code/Lib trigrams .ert 文 件 里 。 







































































19.4.1 三 字母 组 合 和 迭代 函数 


定义 一 个 名 为 for each trigram in the engLish Language(F，A) 的 困 数 。 这 个 困 数 会 
把 fun F 应 用 到 英语 里 的 每 一 个 三 字母 组 合 上 。F 是 一 个 类 型 为 fun(Str，A) -> A 的 fun，Str 涵 
盖 了 英 霹 里 所 有 的 三 字母 组 合 ，A 则 是 一 个 累加 规 。 

要 编写 这 个 友 代 六 数 ， 需 要 一 个 庞大 的 单词 表 。( 注意 : 我 在 这 里 称 它 为 迭代 函数 ， 但 是 更 
严格 来 说 ， 它 其 实 是 一 个 很 像 Lists:fotLdL 的 折 和 三 操 作 符 。) 我 使 用 了 一 个 包含 354 984 个 英 霹 单 
词 的 集合 ”来 生成 三 字母 组 合 。 利 用 这 个 单词 表 ， 可 以 定义 三 字母 组 合 的 迭代 隐 数 如 下 : 











lib_trigrams.erl 

for each trigram in the english language(F, A0) -> 
{ok, Bin0} = file:read file("354984si,ngl.gz"), 
Bin = zlib:gunzip(BinO), 
scan word list(binary to list(Bin), F, A0). 


GD http://pragprog.com/titles/jaerlang2/source code 
@) http://www.dcs.shef.ac.uk/research/ilash/Moby/ 
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scan word list([], ，A) -> 
A; 
scan word list(L, F, A) -> 
{Word, Ll} = get next word(L, [1]), 
Al = scan trigrams([$\s|Word], F, A), 
scan word list(L1l, F, Al). 


%% 扫描 单词 ， 寻 找 \r\n。 
%% 第 二 个 参数 是 ( 反 转 的 ) 单词 ， 
%% 所 以 必须 在 找到 N\FNn 或 扫描 完 字 符 时 把 它 反 转 回来 


get next word([$r,$nlT]，L) -> {reverse([$\s|L]), T}; 
get next word([H|T], L) -> get next word(T, [HI|L]); 
get next word([], L) -> {reverse([$\s|L]), [1}. 


scan trigrams([X,Y,Zz], F, A) -> 
F([X,Y,Z], A); 
scan trigrams([X,Y,Z|T], F, A) -> 
Al = F([X,Y,Z2Z], A), 
scan trigrams([Y,Z|T], F, Al); 
scan trigrams( ， ，A) -> 
A. 

这 里 有 两 点 要 注意 。 首 匈 ,， 用 zlLib:gunzip(Bin) 解 压缩 源 文件 里 的 二 进 制 数据 。 这 个 单词 
表 相 当 长 ， 所 以 我 们 更 希望 让 它 以 压缩 文件 的 形式 保存 在 磁盘 上 ， 而 不 是 原始 的 ASCII 文 件 。 其 
次 ， 在 每 个 单词 的 前 后 各 加 了 一 个 空格 。 进 行 三 字母 组 合 分 析 时 ,我 们 希望 把 空格 当成 一 个 普通 
字母 。 











19.4.2 ”创建 一 些 表 
我 们 将 像 这 样 创建 ETS 表 : 


lib_trigrams.erl 


make ets ordered set() -> make a set(ordered set, "trigrams0s. tab"). 
make ets set() -> make a set(set, "trigramss. tab"). 


make a set(Type, FileName) -> 
Tab = ets:new(table, [Type]), 
F = fun(Str, ) -> ets:insert(Tab, {list to binary (Str)}) end, 
for_each trigram in the english language(F, 0), 
ets:tab2file(Tab, FileName), 
Size = ets:info(Tab, size), 
ets:delete(Tab), 
Size. 


请 注意 ， 当 我 们 分 离 出 一 个 三 字母 组 合 ABC 时 ， 实 际 上 是 把 元 组 {<<"ABC">>} 搬 人 了 代表 各 
种 三 字母 组 合 的 ETS 表 里 。 这 看 起 来 很 滑稽 : 元 组 里 只 有 一 个 元 素 。 元 组 通常 是 多 个 元 素 的 容器 ， 
所 以 让 元 组 只 包含 一 个 元 素 是 违反 常识 的 。 但 是 请 记 住 ，ETS 表 里 的 所 有 条 目 都 是 元 组 ， 而 且 在 
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默认 情况 下 元 组 的 键 丈 是 它 的 第 一 个 元 素 。 所 以 对 我 们 来 说 ，{Key} 代 表 了 一 个 没有 值 的 键 。 
接 下 来 的 代码 将 创建 一 个 包含 所 有 三 字母 组 合 的 异 键 表 (这 次 用 的 是 Erlang 模 块 sets， 而 不 
是 ETS ): 


lib_trigrams.erl 


make mod set() -> 

= sets:new!(), 

= fun(Str, Set) -> sets:add element({list to binary(Str),Set) end, 
D1 = for each trigram in the english language(F, D), 

file:write file("trigrams,.set", [term to binary(D1)]). 


TT 己 | 


19.4.3 创建 表 所 需 的 时 间 


本 章 最 后 列 出 的 Lib trigrams:make tabtLes() 国 数 负 责 创 建 所 有 的 表 。 它 包含 一 些 测试 
功能 ， 这 样 就 能 测量 表 的 大 小 以 及 创建 表 所 需 的 时 间 。 

1> tib trigrams:make tables(). 

Counting - No of trigrams=3357707 time/trigram=0.577938 

Ets ordered Set size=19.0200 time/trigram=2.98026 

Ets set size=]19.0193 time/trigram=1.5371]1 


Module Set size=9.43407 time/trigram=9.32234 
OK 


它 告诉 我 们 一 共有 330 万 个 三 字母 组 合 ， 以 及 处 理 单词 表 里 的 每 个 三 字母 组 合 需要 花 半 微 秒 
的 时 间 。 

每 个 三 字母 组 合 的 插入 时 间 在 ETS 有 序 异 键 表 里 是 2.9 微 秒 ， 在 ETS 异 键 表 里 是 1.5 微 秒 ， 在 
Erlang 异 键 表 则 里 是 9.3 微 秒 。 就 存储 而 言 ， 每 个 三 字母 组 合 在 ETS 异 键 表 和 有 序 异 键 表 里 都 占用 
19 个 字 节 ， 而 在 sets 模 块 里 是 9 个 字 节 。 



































19.4.4 ”访问 表 所 需 的 时 间 

好 吧 , 看 来 创建 这 些 表 需要 一 定 的 时 间 , 但 它 不 是 这 个 案例 的 重点 。 现 在 编写 一 些 代码 来 测 
量 访问 时 间 。 我 们 将 对 表 里 的 每 一 个 三 字母 组 合 各 查询 一 次 , 然后 得 出 平均 查询 时 间 。 这 是 执行 
计时 的 代码 : 

















lib_trigrams.erl 

timer tests() -> 
time lookup ets set("Fts ordered Set", "trigrams0s,.tab"), 
time lookup ets set("Fts set", "trigramss. tab"), 
time lookup module sets(). 


time lookup ets set(Type, File) -> 
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{ok, Tab} = ets:file2tab(File), 

L = ets:tab2list(Tab), 

Size = Length(L) ， 

{M, } = timer:tc(?MODULE, lookup all ets, [Tab, L]), 
ijo:format("~s Lookyp=~p micro seconds~n",[Type, M/Sizel]), 
ets:delete(Tab). 


lookup all ets(Tab, L) -> 
lists:foreach(fun({K}) -> ets:lookup(Tab, K) end, L). 


time lookup module sets() -> 
{ok, Bin} = file:read file("trigrams.set'"), 
Set = binary to term(Bin), 
Keys = sets:to list(Set), 
Size = length (Keys), 
{M, } = timer:tc( ?MODULE, lookup all set, [Set, Keys]), 
io:format("Module set lookup=~p micro seconds~n", [M/Sizel]). 





lookup all set(Set, L) -> 
lists:foreach(fun(Key) -> sets:is element(Key, Set) end, L). 


现在 我 们 开始 : 


1> lib trigrams:timer tests( ) . 

Ets ordered Set lookup=1.79964 micro seconds 
Ets set lookup=0.719279 micro seconds 

Module sets lookup=1.35268 micro seconds 

ok 


这 些 时 间 是 平均 每 次 查询 所 需 的 微 秒 数 。 
19.4.5 ”获胜 者 是 ……: 


结 东 和 是 压倒 性 的 ，ETS 异 键 表 以 相当 大 的 优势 取得 了 胜利 。 在 我 的 机 秦 上 ，sets 每 次 查询 耗 
时 半 微 秒 ， 这 是 非常 好 的 成 绩 ! 


注意 ”执行 前 面 这 样 的 测试 来 实际 测量 某 个 操作 的 耗 时 是 一 种 良好 的 编程 实践 。 无 需 将 此 做 到 
极致 来 把 所 有 耗 时 都 测试 一 遍 ， 比 如 给 所 有 操作 计时 ， 只 需 针 对 程序 里 那些 最 耗 时 的 操 
作 即 可 。 那 些 不 太 耗 时 的 操作 应 该 尽量 用 最 优美 的 方式 进行 编写 。 如 果 我 们 因为 效率 的 
原因 被 迫 编写 一 些 不 直观 的 丑陋 代码 ， 就 应 该 加 上 详细 的 文档 。 














现在 可 以 编写 预测 字符 帅 是 否 是 正规 英语 单词 的 困 效 了 。 
为 了 测试 东 个 字符 昌 是 否 可 能 是 英语 单词 , 我们 将 过 历 字 符 串 里 的 所 有 三 字母 组 合 , 检查 它 
们 是 否 包 含 在 之 前 计算 出 的 三 学 母 组 合 表 里 。is_word 函 数 做 的 就 是 这 件 事 。 
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lib_trigrams.erl 


1s word(Tab, Str) -> 1is wordl(Tab, "ls ++ Str ++ "\s"). 
js wordl(Tab, [ , ,， 1]=X) -> 1S this a trigram(Tab, X), 
1s wordl(Tab, [A,B,C|D]) -> 
case 1is this a trigram(Tab, [A,B,cC]) of 
true -> ls wordl(Tab, [B,C|D]); 
false -> false 
end ; 
ls wordl( ， ) -> 
faLse ， 
js this a trigram(Tab, X) -> 
case ets:lookup(Tab, list to binary(X)) of 
[] -> false; 
-> true 
end ， 
open() -> 
File = filename:]Join(filename:dirname (code:which(?MODULE)), 
"/trigramss. tab"), 
{ok, Tab} = ets:file2tab(File), 
Tab. 
close(Tab) -> ets:delete(Tab)., 


函数 open 会 打开 我 们 之 前 计算 出 的 ETS 表 ， 它 必须 在 is _word 之 前 调用 。 
此 处 用 到 的 另 一 个 技巧 , 正 是 我 定位 包含 三 字母 组 合 表 的 文件 时 的 做 法 , 就 是 把 它 保 存在 与 
当前 模块 代码 相同 的 目录 里 。code:which(?MODULE) 会 返回 ?MODULE 目 标 代码 所 属 文件 的 名 称 。 


19.5 ”保存 元 组 到 磁盘 


ETS 表 把 元 组 保存 在 内 存 里 ， 而 DETS 提 供 了 把 Erlang 元 组 保存 到 磁盘 上 的 方法 。DETS 的 最 
大 文件 大 小 是 2GB。DETS 文 件 必 须 先 打开 才能 使 用 ， 用 完 后 还 应 该 正确 关闭 。 如 果 没 有 正确 关 
闭 ， 它 们 就 会 在 下 次 打开 时 目 动 进行 修复 。 因 为 修复 可 能 会 花 很 长 一 段 时 间 ， 所 以 先 正确 关闭 它 
们 再 结束 程序 是 很 重要 的 。 

DETS 表 有 着 和 ETS 表 不 同 的 共享 属性 。DETS 表 在 打开 时 必须 赋予 一 个 全 局 名 称 。 如 果 两 个 
或 更 多 本 地 进程 用 相同 的 名 称 和 选项 打开 某 个 DETS 表 ， 它 们 就 会 共享 这 个 表 。 这 个 表 会 一 直 处 
于 打开 状态 ， 直 到 所 有 进程 都 关闭 它 〈 或 者 天 省 )。 


范例 : 文件 名 索引 


创建 一 个 基于 磁盘 的 表 ， 它 将 把 文件 名 映射 到 整数 上 ， 反 之 亦 然 。 我 们 将 定义 吨 数 
filename2index 和 它 的 逆 郧 数 ijndex2filename。 
为 了 实现 这 个 索引 ， 我 们 将 创建 一 个 DETS 表 ， 然 后 用 三 种 不 同类 型 的 元 组 填充 它 。 
© {free, N} 
N 是 表 里 的 第 一 个 空 蝗 索引。 当 我 们 在 表 里 输入 一 个 新 文件 名 时 ， 就 会 指派 索引 N 给 它 。 
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@ {FileNameBin, K} 
FileNameBin (一 个 二 进 制 型 ) 被 指派 了 索引 K。 
@ {K, FileNameBin} 
K (一 个 整数 ) 代表 文件 FiLenameBin。 
请 注意 ， 每 个 新 添加 的 文件 都 会 在 表 里 增 加 两 个 条 目 : 一 个 File 一 Index 条 目 和 一 个 逆 癌 
的 Index 一 Filename 条 目 。 这 是 出 于 效率 的 原因 。 当 ETS 或 DETS 表 建立 时 ， 元 组 里 只 有 一 个 
元 系 充 当 键 的 角色 。 匹 配 某 个 非 键 元 组 元 系 虽 然 可 行 , 但 非常 低 效 ， 因 为 它 涉及 对 整个 表 进 行 搜 
索 。 当 整个 表 都 在 磁盘 上 时 ， 这 个 操作 的 代价 尤其 高 昂 。 
现在 来 编写 这 个 程序 。 首先 编写 打开 和 关闭 DETS 表 的 函数 , 这 个 表 用 来 保存 所 有 的 文件 名 。 

















lib_filenames_dets.erl 
-module(lib filenames dets). 
-export([open/l1, close/0, test/0, filename2index/l1, index2filename/1]). 


open(File) -> 
ijo:format("dets opened:~p~n", [File]), 
Bool = filelib:is file(File), 
case dets:open file(?MODULE, [{file, File}]) of 
{ok, ?MODULE} -> 
case Bool of 
true -> void,; 
false -> ok = dets:insert(?MODULE, {free,1}) 
end, 
true,; 
{error,Reason} -> 
io:format("cannot open dets table~n"), 
exit({eDetsOpen, File, Reason}) 
end , 


close() -> dets:close({?MODULE). 


open 的 代码 会 自动 初始 化 DETS 表 ， 方法 是 在 创建 新 表 时 插入 {free，1} 元 组 。 如 有 果 File 存 
在 ，filelib:is file(File) 就 会 返回 true， 否则 返回 false。 请 注意 ，dets:open file 或 者 
创建 一 个 新 文件 ， 或 者 打开 一 个 现 有 文件 ， 这 就 是 必须 在 调用 dets :open_ file 前 先 检 查 文件 是 
否 存在 的 原因 。 

我 们 在 这 段 代 码 里 多 次 使 用 了 ?MODULE 宏 ， 它 会 展开 成 当前 的 模块 名 ( 即 
Lib _filenames_dets )。 许 多 针对 DETS 的 函数 调用 需要 一 个 唯一 的 原子 参数 作为 表 和 名 。 单 赁 模 
块 名 就 能 生成 一 个 唯一 的 表 名 。 因 为 系统 里 不 能 有 两 个 名 称 相同 的 Erlang 模 块 ， 所 以 如 果 处 处 遵 
循 这 一 惯例 ， 就 有 理由 认定 我 们 有 一 个 可 以 用 于 表 名 的 唯一 名 称 。 

我 每 次 都 用 ?MODULE 安 而 不 是 显 式 指定 模块 名 ,这 是 因为 我 有 一 个 习惯 ， 就 是 会 在 编写 代码 
的 过 程 中 修改 模块 名 。 用 了 宏 之 后 ， 即 使 修改 了 模块 名 ， 代 码 也 会 是 正确 的 。 

打开 文件 之 后 ， 回 表 里 插入 一 个 新 文件 名 就 很 徐 单 了 。 它 是 由 fiLename2index 调 用 产生 的 
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副作用 实现 的 。 如 末 文 件 名 在 表 里 ， 丈 会 返回 它 的 索引 ， 否则 就 会 生成 一 个 新 索引 并 更 新 表 ， 而 
这 次 更 新 会 使 用 三 个 元 组 。 


lib filenames dets.erl 


filename2index (FileName) when 1s binary(FileName) -> 
case dets:lookup(?MODULE, FileName) of 

[] -> 
[{ ,Free}] = dets:lookup(?MODULE, free), 
ok = dets:insert(?MODULE, 

[{Free,FileName}, {FileName,Free}, {free,Free+l}]), 

Free ; 

[{_,N}] -> 
N 


end. 

请 注意 我 们 是 如 何 把 三 个 元 组 保存 到 表 里 的 。dets:insert 的 第 二 个 参数 既 可 以 是 一 个 元 
组 , 也 可 以 是 一 个 元 组 列表 。 男 外 要 注意 的 是 文件 名 用 一 个 二 进 制 型 表示 , 这 是 出 于 效率 的 原因 。 
建议 你 养 成 在 ETS 和 DETS 表 里 用 二 进 制 型 来 表示 字符 串 的 习惯 。 

细心 的 读者 也 许 会 注意 到 filename2index 里 有 一 处 潜在 的 羌 争 状况 。 如 果 在 dets:insert 
尚未 被 调用 时 有 两 个 并 行进 程 调用 了 dets :lookup, fiLename2index 就 会 返回 一 个 不 正确 的 值 。 
为 了 让 这 个 函数 能 正常 工作 ， 必 须 确保 任 一 时 刻 都 只 能 有 一 个 进程 调用 它 。 

把 索引 转换 成 文件 名 非常 价 单 。 

















lib_filenames_dets.erl 

index2filename (Index) when is integer(Index) -> 

case dets:lookup(?MODULE, lndex) of 
[] -> error,; 
[{_,Bin}] -> Bin 

end, 

这 里 做 了 一 个 小 小 的 设计 决定 : 调用 index2filename (Index) 时 如 果 没 有 文件 名 关联 这 个 
索引 该 怎么 办 。 可 以 调用 exit (ebadIndex) 来 让 调用 进程 衣 演 , 但 在 这 里 我 们 选择 了 一 种 更 温和 
的 方式 : 只 返回 原子 error。 调 用 进程 能 够 分 辨 出 合法 文件 名 和 不 正确 的 什 ， 因 为 所 有 合法 返回 
的 文件 名 都 是 二 进 制 型 。 

另外 还 需要 注意 filename2index 和 index2filename 里 的 关卡 测试 。 它 们 检查 参数 是 否 为 
所 要 求 的 类 型 。 做 这 些 测试 是 一 个 好 主意 ， 因 为 把 错误 类 型 的 数据 输入 DETS 表 可 能 会 造成 非常 
难以 调试 的 情况 。 可 以 想象 一 下 ， 如果 把 错误 类 型 的 数据 保存 在 表 里 然 后 过 几 个 月 再 读 取 它 ， 那 
时 做 什么 都 已 经 太 晚 了 。 最 好 的 做 法 是 先 检 查 所 有 数据 的 正确 性 ， 然 后 再 把 它们 添加 到 表 里 。 


19.6 ”其 余 操 作 


ETS 和 DETS 表 还 支持 许多 尚未 在 本 章 里 介绍 过 的 操作 。 这 些 操 作 分 为 以 下 几 类 : 
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口 基于 模式 获取 和 删除 对 和 象 ; 

口 ETS 和 DETS 表 之 间 ， 以 及 ETS 表 和 磁盘 文件 之 间 的 相互 转换 ; 

口 查看 表 的 资源 占用 情况 ; 

口 笛 历 表 内 所 有 元 素 ; 

口 修复 损坏 的 DETS 表 ; 

口 让 表 可 视 化 。 

网 上 可 以 找到 更 多 关于 ETS" 和 DETS” 的 信息 。 

ETS 和 DETS 表 被 设计 用 来 对 Erlang 数 据 进行 高 效 的 抵 层 内 存 和 磁盘 存储 ,但 它们 并 不 是 终极 
解决 方案 。 对 于 更 复 森 的 数据 存储 而 言 ， 我 们 需要 一 种 数据 库 。 

在 下 一 草 里 ， 我 们 将 介绍 Mnesia， 它 是 一 种 用 Erlang 编 写 的 实时 数据 库 ， 也 是 标准 Erlang 分 
发 套装 的 一 部 分 。Mnesia 的 内 部 使 用 ETS 和 DETS 表 , 而 且 ets 和 dets 模 块 导出 的 函数 中 有 许多 是 
供 Mnesia 内 部 使 用 的 。Mnesia 能 做 各 种 用 单个 ETS 和 DETS 表 无 法 实现 的 操作 。, 例如 , 可 以 索引 主 
键 以 外 的 元 系 ， 因 此 我 们 在 fijlename2index 示 例 里 使 用 的 两 次 插入 技巧 就 不 再 是 必需 的 了 。 
Mnesia 实 际 上 会 创建 多 个 ETS 或 DETS 表 来 做 到 这 一 点 ， 但 这 些 对 用 户 是 隐藏 的 。 


























19.7 练习 


(1) Mod:modute info(exports) 会 返回 Mod 模 块 里 所 有 导出 因数 的 列表 。 用 这 个 天 数 找 出 
Erlang 系 统 库 里 导出 的 所 有 荫 数 。 制 作 一 个 键 - 值 查 询 表 ， 其 中 键 是 一 个 {Function,Arity} 对 ， 
值 是 一 个 模块 名 。 把 这 些 数 据 储 存在 ETS 和 DETS 表 里 。 











提示 使 用 code:Lib dir() 和 code:Lib dir(LibName) 来 找 出 系统 里 所 有 模块 的 名 称 。 


(2) 制作 一 个 共享 的 ETS 计 数 表 。 实现 一 个 名 为 count :me(Mod,Line) 的 函数 , 通过 在 你 的 代 
码 里 添加 count :me(?MODULE，?LINE) 来 调用 它 。 每 当 这 个 函数 被 调用 时 ， 就 给 记录 目 身 执行 次 
数 的 计数 器 加 1。 编 写 一些 函 数 来 初始 化 和 读 取 计 数 器 。 

(3) 编写 一 个 检测 文本 抄袭 的 程序 。 用 一 个 双 遍 历 (two-pass ) 算法 来 实现 它 。 第 一 次 遍历 时 ， 
把 文本 打 散 成 40 个 字符 的 小 块 并 计算 各 个 块 的 校 验 和 ， 然 后 把 校 验 和 与 文件 名 保存 在 一 个 ETS 表 
里 。 第 二 次 遍历 时 , 计算 数据 里 各 个 40 字 符 块 的 校 验 和 , 并 把 它们 与 ETS 表 里 的 校 验 和 进行 比较 。 





提示 “要 做 到 这 一 点 ， 需 要 计算 “滚动 校 验 和 ”2 。 举 个 例子 ， 假 如 C1 = Bl + B2 + ... B40 
并 且 C2 = B2 + B3 + ..，B41， 你 就 可 以 快速 计算 出 C2， 因 为 通过 观察 能 发 现 C2 = Cl + 
B41 - Bl。 


GD http://www.erlang.org/doc/man/ets.html 
@) http://www.erlang.org/doc/man/dets.html 
@) http://en.wikipedia.org/wiki/Rolling hash 
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要 编写 一 个 多 用 户 游戏 、 制 作 一 个 新 网 站 ,或 者 创建 一 个 在 线 文 付 系统 ,多 半 需 要 一 个 数据 
库 管理 系统 ( Database Management System， 人 简称 DBMS )。 

Mnesia 是 一 种 用 Erlang 编 写 的 数据 库 , 它 被 用 于 高 要 求 的 电信 应 用 程序 , 同时 也 是 标准 Erlang 
分 发 套装 的 一 部 分 。 将 它 配 置 为 内 存 复制 后 , 就 能 在 两 个 物理 隔离 的 节点 上 实现 快速 的 容错 式 数 
据 存 储 。 它 还 文 持 事务 ， 并 有 目 己 的 查询 语言 。 

Mnesia 的 速度 极 快 ， 可 以 保存 任何 类 型 的 Erlang 数 据 结 构 。 它 还 是 高 度 可 定制 的 。 数 据 表 既 
可 以 保存 在 内 存 里 (为 了 速度 )， 也 可 以 保存 在 磁盘 上 (为 了 持久 性 )。 表 还 可 以 在 不 同 机 硕 之 间 
进行 复制 ， 从 而 实现 容错 行为 。 


20.1 创建 初始 数据 库 


在 做 任何 事 之 前 ， 必 须 先 创建 一 个 Mnesia 数 据 库 。 这 件 事 只 需要 做 一 次 。 


$ erl 

1> mnesla:create schemal(l [node()]). 
ok 

2> 1init:stop(). 

OK 

$ [LS 

Mnesia.nonode@nohost 




















mnesia:create schema(NodeList) 会 在 NodeList ( 它 必 须 是 一 个 包含 有 效 Erlang 方 点 的 
列表 ) 里 的 所 有 市 点 上 都 初始 化 一 个 新 的 Mnesia 数 据 库 。 这 个 案例 给 出 的 节点 列表 是 [node()]， 
也 就 是 当前 节点 。Mnesia 完 成 初始 化 并 创建 了 一 个 名 为 Mnesia,nonodeGnohost 的 目录 结构 来 你 
存 数 据 库 。 








为 什么 这 个 DBMS 被 称 为 Mnesia 
它 最 初 的 名 字 是 Amnesia ( 健忘 症 )。 我 们 的 某 个 老板 不 喜欢 这 个 名 字 ， 他 说 :“ 不 能 叫 它 
Amnesia， 没 人 想 要 一 个 会 忘 事 的 数据 库 1” 所 以 我 们 去 挤 了 A， 这 个 名 字 就 留 了 下 来 。 
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然后 退出 Erlang shell， 用 操作 系统 的 Ls 命令 进行 验证 。 

如 果 在 一 个 名 为 joe 的 分 布 式 方 点 上 重复 这 个 练习 ， 就 会 得 到 以 下 输出 。 
$ erl -name joe 

(joe@doris.myerl.example.com) 1> mnesia:create schema([node()]). 
ok 

(joe@doris.myerl.example,com) 2> init:stop(). 

OK 

$ ls 

Mnesia.joe@doris.myerl .example .com 


也 可 以 在 启动 Erlang 时 指 癌 一 个 特定 的 数据 库 。 


$ erl -mnesia dir '"/home/joe/some/path/to/Mnesia.company"' 
1> mnesia:create schema( [node()] ) ， 

ok 

2> 1init:stop(). 

ok 


/home/joe/some/path/to/Mnesia.company 是 将 要 保存 这 个 数据 库 的 目录 。 


20.2 ”数据 库 查 询 


创建 完 数据 库 之 后 ,我 们 就 可 以 拿 它 练 练 手 了 。 首 先 来 看 Mnesia 的 查询 。 浏览 它们 之 后 ,你 
也 许 会 惊讶 地 发 现 Mnesia 的 查询 非常 像 SQL 和 列表 推导 ， 所 以 实际 上 你 不 需要 学 习 什 么 就 能 
手 。 事 实 上 ， 列 表 推 导 和 SQL 之 间 的 高 度 相似 性 并 不 是 什么 奇怪 的 事情 ， 因 为 它们 都 是 基于 数学 
里 的 集合 论 。 

我 在 所 有 的 例子 里 都 假定 你 已 经 创建 了 一 个 包含 shop 和 cost 两 个 表 的 数据 库 。 这 些 表 包 含 
的 数据 如 表 8 和 表 9 所 示 。 


























表 8 shop 表 
商 品 数 量 费 用 
apple 20 2.3 
orange 100 3.8 
pear 200 3.0 
banana 420 4.5 
potato 2456 1.2 
表 9 ”cost 表 
名 称 价 格 
apple 1.5 
orange 2.4 
pear 2.2 
banana 1.5 


potato 0.6 
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Mnesia 里 的 表 是 一 个 包含 右 十 行 的 寞 键 或 同 键 表 ， 其 中 每 一 行 部 是 一 个 Erlang 记 录 。 要 在 
Mnesia 里 表示 这 些 表 ， 逢 要 一 些 记录 定义 来 对 表 里 的 行进 行 定义 ， 代 码 如 下 : 


test mnesia.erl 














-record(shop, {item, quantity, cost}). 
-record(cost, {name, price})., 


在 操作 数据 库 之 前 ， 需 要 创建 一 个 数据 库 架 构 ( schema )， 启 动 数据 库 ， 添 加 一 些 表 定义 并 
停 目 数据库， 然后 再 重启 它 。 这 些 事 只 需要 做 一 遍 。 下 面 是 代码 : 





test_mnesia.erl 

do_this once() -> 
mnesia:create schema([node()]), 
mnesia:start(), 


mnesia:create table(shop, [{attributes, record info(fields, shop)}]), 
mnesia:create tablel(cost, [{attributes, record info(fields, cost)}]), 
mnesia:create table(design, [{attributes, record info(fields, design)}]), 


mnesia:stop(). 


1> test mnesia:do this once( ) . 

stopped 

=INFO REPORT==== 24-May-2013::15:27:56 === 
application: mnesia 

exited: stopped 

type: temporary 


接 下 来 看 一 下 具体 示例 。 
20.2.1 ”选择 表 里 的 所 有 数据 

下 面 是 选择 shop 表 里 所 有 数据 的 代码 。( 对 那些 展 SQL 的 读者 ， 我 们 在 代码 里 用 注释 符号 开 
头 的 片段 展示 了 能 执行 相应 操作 的 等 效 SQL 命 令 。) 

test mnesia.erl 


%%6 等 效 9QL 命 令 
%5%5 SELFECT * FROM shop; 











demo(select shop) -> 
do(qlc:q([X || X <- mnesia:table(shop)])); 


这 段 代 码 的 重点 是 qtc:q 调 用 ， 它 会 把 查询 ( 也 就 是 它 的 参数 ) 编译 成 一 种 用 于 查询 数据 库 
的 内 部 格式 。 把 编译 后 的 查询 传递 给 一 个 名 为 do ( ) 的 函数 , 它 会 在 接近 test_mnesia 底 部 的 位 置 
进行 定义 ， 负 责 运 行 查 询 并 返回 结 有 末 。 为 了 让 这 一 切 能 够 轻易 从 erL 里 调用 ， 我 们 把 它 映 射 到 郴 
数 demo (select shop) 上 。( 整个 模块 位 于 code/test mnesia.erl 文 件 内 , 可 以 在 本 书 的 主页 ” 
里 找到 。) 








GD http://pragprog.com/titles/jaerlang2/source _ code 
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在 使 用 这 个 数据 库 之 前 , 需要 做 一 些 例 行 的 启动 和 和 载 人 表 定 义工 作 。 它们 必须 在 使 用 数据 库 
之 前 运行 ， 但 在 每 个 Erlang 会 话 里 只 需 运 行 一 次 。 





test mnesia.erl 
%% 等 级 SQL 命 邻 
%% SELECT * FROM shop; 


demo (select shop) -> 
do(qlc:q([X || X <- mnesia:table(shop)])); 


现在 可 以 局 动 数 据 库 并 生成 一 个 查询 了 。 


1> test mnesia:start(). 

ok 

2> test mnesia:reset tables(). 
{atomic, ok} 

3> test mnesia:demo(select shop). 
[{shop,potato, 2456, 1.2}, 
{shop,orange, 100,3.8}, 
{shop,apple, 20,2.3}, 

{shop,pear, 200,3.6}, 
{shop,banana,420,4.5}] 


注意 表 里 各 行 出 现 的 顺序 是 随机 的 。 


在 这 个 示例 中 构建 查询 的 代码 行 如 下 : 

qlc:q([X || X <- mnesia:table(shop)]) 

它 看 上 去 非常 像 一 个 列表 推导 (参见 4.5 节 )。 事 实 上 ，qLc 就 代表 了 query list comprehension 
( 查询 列表 推导 )。 它 是 其 中 一 个 可 以 用 来 访问 Mnesia 数 据 库 内 数据 的 模块 。 

[X || X<- mnesia:table(shop)] 的 意思 是 “一 个 由 Xx 组 成 的 列表 ,X 提 取 自 shop 这 个 Mnesia 
表 ”。X 的 值 是 Erlang 的 shop 记 录 。 




















注意 qlc:q/1 的 参数 必须 是 一 个 字面 上 的 列表 推导 ， 不 能 是 通过 求 值得 出 的 。 举 个 例子 ， 下 
面 的 代码 与 示例 里 的 代码 不 是 等 价 的 。 


Var = [XxX || XxX <- mnesia:table{shop)], 
qlc:q(Var) 


20.2.2 ”从 表 里 选 择 数 据 


下 面 这 个 查询 会 从 shop 表 里 选择 item 和 quantity 列 : 
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test_ mnesia.erl 
%% 等 效 5QL 命 令 
%% SELECT item, quantity FROM shop; 


demo(select some) -> 
do{(qlc:9q([{xX#shop.item, X#shop.quantity} || XxX <- mnesia:table(shop)])); 


4> test mnesia:demo(select some). 
[{orange, 100}, {pear, 200}, {banana,420}, {potato, 2456}, {apple, 20}] 


上 面 这 个 查询 里 的 X 值 是 类 型 为 shop 的 记录 。 回想 一 下 5.2 市 里 介绍 过 的 记录 语法 , 你 就 会 记 
得 X#shop .item 指 的 是 shop 记 录 里 的 Item 字段。 因此 ,元 组 {X#shop .item，X#shop. quantity} 
是 一 个 由 X 的 item 和 quantity 字 段 所 组 成 的 元 组 。 


20.2.3 ”从 表 里 有 条 件 选 择 数 据 


下 面 这 个 查询 会 列 出 shop 表 里 所 有 符合 条 件 ( 库存 数量 小 于 250 ) 的 商品 。 也 许可 以 用 它 来 
确定 哪些 商 需要 再 次 订购 。 请 注意 这 个 条 件 如 何 上 自然 地 表达 为 列表 推导 的 一 部 分 。 


test_mnesia.erl 

%% 等 效 9QL 命 令 

%% SELECT shop.item FROM shop 
%% WHERE shop.quantity < 250， 














demo (reorder) -> 
do(qtc:q({Xx#shop.item || X <- mnesia:tabte{shop), 
X#shop.quantity < 250 
1)); 


5> test mnesia:demo(reorder). 
[orange, pear ,appliel] 


20.2.4 ”从 两 个 表 里 选 择 数据 (联接) 


现在 假设 想 要 重新 订购 的 商品 必须 库存 少 于 250， 并 且 价 格 低 于 2.0 个 货币 单位 。 要 做 到 这 一 
点 ， 我 们 震 要 访问 两 个 表 。 这 个 查询 如 下 : 


test_mnesia.erl 

%% 等 效 5QL 命 令 

SELECT shop.item 

FROM shop, cost 

WHERE shop.item = cost.name 
AND cost.price < 2 
AND shop.quantity < 250 


co oo on oP 
oo 只 oo of 


oc 
oo 


demo(join) -> 
do(glc:q([Xx#shop.item || X <- mnesia:table(shop), 
X#shop.quantity < 250, 


20.3 添加 和 移 除数 据 库 里 的 数据 


Y <- mnesia:table(cost), 
X#shop.item =:= Y#cost.name, 
Y#cost.price < 2 


] )). 


6> test mnesia:demo(join). 





[apple] 
这 里 的 关键 在 于 联接 shop 表 里 的 item 名 称 和 cost 表 里 的 name。 
X#shop.1item =:= Y#cost.name 


20.3 ”添加 和 移 除 数据 库 里 的 数据 
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我 们 再 次 假定 你 已 经 创建 了 数据 库 并 定义 了 一 个 shop 表 。 现在 我 们 想 为 该 表 添 加 或 移 除 行 。 


20.3.1 添加 行 
可 以 像 下 面 这 样 给 shop 表 添加 一 行 : 


test mnesia.erl 


add shop item(Name, Quantity, Cost) -> 
Row = #shop{item=Name, gquantity=Quantity, cost=Cost}, 
F = fun() -> 
mnesiai:write (Row) 
end, 
mnesia:transaction(F). 


它 会 创建 一 个 shop 记 录 并 把 它 插入 表 中 。 


1]> test mnesia:start(). 

ok 

2> test mnesia:reset tabLes ( ) . 
{atomic, ok} 

%% 列 出 Shop 表 

3> test mnesia:demo(select shop). 
[{shop,orange, 100,3.80000}, 
{shop, pear, 200,3.60000}, 
{shop, banana, 420,4.50000}, 
{shop,potato, 2456 ,1.20000}, 
{shop,apple, 20,2.30000}] 

%% 添加 一 个 新 行 

4> test mnesia:add shop item(orange, 236, 2.8). 
{atomic,ok} 

%% 再 次 列 出 Shop 表 ， 看 看 有 什么 变化 

5> test mnesia:demo(select shop). 
[{shop, orange, 236,2.80000}, 
{shop, pear, 200,3.60000}, 

{shop, banana, 420,4.50000}, 
{shop,potato, 2456, 1 .20000}, 
{shop,apple, 20,2.30000}] 
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注意 shop 表 的 主键 是 表 内 的 第 一 列 ， 也 就 是 shop 记 录 里 的 item 字 段 。 这 个 表 属 于 “ 异 键 ”类 
型 (参见 19.1 节 里 对 异 键 和 同 键 类 型 的 讨论 )。 如 果 新 创建 的 记录 和 数据 表 里 的 某 一 行 具 
有 相同 的 主键 ， 就 会 覆盖 那 一 行 ， 否则 就 会 创建 一 个 新 行 。 
20.3.2 ” 移 除 行 
要 移 除 某 一 行 ， 需 要 知道 该 行 的 对 象 ID ( ObjectID, 简称 OID )。 它 由 表 名 和 主键 的 值 构成 。 











test mnesia.erl 


remove shop item(Item) -> 
0id = {shop, ltem}, 
F = fun() -> 
mnesia:delete(01id) 
end, 
mnesia:transaction(F). 


6> test mnesia:remove shop item(pear). 

{atomic,ok} 

%% 列 出 这 个 表 ，pear 已 经 不 见 了 

7> test mnesia:demo(select shop). 
[{shop,orange, 236,2.80000}, 
{shop,banana, 420,4.50000}, 
{shop,potato, 2456, 1.20000}, 
{shop,apple, 20,2.30000}] 

8> mnes1la:stop( ) . 

ok 


20.4 Mnesia 事务 
之 前 向 数据 库 添 加 或 移 除 数据 以 及 进行 查询 时 ， 我 们 编写 了 如 下 代码 : 


do something(...) -> 
F = fun() -> 


3 





mnesia:write (Row) 
各 ,,， 或 者 ,，,， 


mnesia':delete(0id) 


a 
qlc:e(Q) 
end, 
mnesia:transaction{(F) 


F 是 一 个 不 带 参 数 的 fan。 我 们 在 F 里 调用 了 下 列 因数 的 某 种 组 合 形式 : mnesia:write/1、 
mnesia:detete/1 和 qtc:e(Q) (0Q 是 用 qlc:q/1 编 译 的 查询 )。 构 建 完 fn 后 ， 调 用 
mnesia:transaction(F)， 它 会 执行 fun 里 的 表达 式 序列 。 

事务 (transaction ) 能 阻止 有 缺陷 的 程序 代码 ， 但 更 重要 的 是 ， 它 能 阻止 对 数据 库 的 并 发 访 
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问 。 假 设 有 两 个 进程 试图 同时 访问 相同 的 数据 。 比 方 说 ， 假 设 我 的 银行 账户 里 有 10 美 元 ， 有 两 个 
人 试图 同时 从 这 个 账户 里 取出 8 美元 。 我 希望 让 其 中 一 笔 交 易 〈 即 事务 ) 成 功 ， 而 另 一 笔 失 败 。 

这 正 是 mnesia:transaction/1 所 提供 的 保证 。 某 个 事务 里 对 数据 表 的 读 写 操作 或 者 都 成 
功 , 或 者 都 不 成 功 。 如 果 都 不 成 功 ， 我 们 就 会 说 这 个 事务 失败 了。 如 果 事 务 失 败 了 ， 就 不 会 对 数 
据 库 做 任何 改动 。 

Mnesia 采 用 一 种 悲观 锁定 〈pessimistic locking ) 的 策略 。 每 当 Mnesia 事 务 管理 侣 访问 一 个 表 
时 ， 都 会 根据 上 下 文 情 况 和 尝试 锁定 记录 甚至 整个 表 。 如 采 它 发 现 这 可 能 导致 死 锁 ,就 会 立即 中 止 
事务 并 撤销 之 前 所 做 的 改动 。 

如 果 因 为 其 他 进程 正在 访问 数据 而 导致 事务 一 开始 就 失败 了 ， 系 统 就 会 进行 短 时 间 的 等 得 ， 
然后 再 次 尝试 执行 事务 。 这 人 么 做 的 一 种 结果 就 是 事务 fun 里 的 代码 可 能 会 被 执行 很 多 次 。 

出 于 这 个 原因 ， 事 务 fun 里 的 代码 不 应 该 做 任何 沉 有 副作用 的 事情 。 举 个 例子 ， 如 果 打 算 编 
写 以 下 代码 : 


F = fun() -> 






































io:format("reading ..."), %% don't do this 


end, 
mnesia:transaction(F), 


也 许 就 会 得 到 大 量 输出 ， 因 为 这 个 fan 可 能 会 被 多 次 重 试 。 








注意 1 对 mnesia:write/1 和 mnesia:deLete/1 的 调用 只 应 该 出 现在 由 mnesia:transaction/1 
处 理 的 fun 内 部 。 

注意 2 永远 不 要 编写 代码 米 显 式 捕捉 Mnesia 访 问 函 数 (mnesia:write/1 和 mnesia: delete/1 
等 ) 里 的 异常 错误 , 因为 Mnesia 的 事务 机 制 本 身 就 依赖 这 些 函 数 在 失败 时 抛 出 异常 错误 。 
如 果 你 捕 提 这 些 异 常 错误 并 试图 自行 处 理 它 们 ， 就 会 破坏 事务 机 制 。 


20.4.1 中 止 事务 

我 们 的 商店 附近 有 一 个 农场 , 那里 有 农民 在 种 植 伴 采 。 这 个 农民 很 喜欢 杰 子 ,他 用 芋 采 来 交 
昂 述 子 。 当 前 的 价格 是 两 个 苹果 换 一 个 术 子 。 因 此 ， 要 购买 N 个 述 子 ， 农 民 需 要 文 付 2*N 个 苹果 。 
下 面 的 丽 数 会 在 农民 购买 栖 子 时 更 新 数据 库 : 

test _ mnesia.erl 


farmer(Nwant) -> 
s5% Nwant = 农民 想 要 购买 的 橙子 数量 

















F = fun() -> 
%%6 找 出 革 果 的 数量 
[Apple] = mnesia:read({shop,apple}), 


Napples = AppLe#shop ,quantity， 

Applel = Apple#shop{quantity = Napples + 2*Nwant}, 
5% 更 新 数据 库 

mnesia:write(Applel), 
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%% 找 出 杰 子 的 数量 
[Orange] = mnesia:read({shop,orange}), 
NOranges = Orange#shop.quantity, 
if 
NOranges >= Nwant -> 
Nl = NOranges - Nwant, 
Orangel = Orange#shop{quantity=N1}, 
%% 更 新 数据 库 
mnesia:write(Qrangel); 
true -> 
5%55 糟 料 ， 橙 子 数 量 不 够 
mnesia:abort (oranges) 


end 
end, 
mnesia:transaction{(F)}). 


这 段 代码 是 用 一 种 相当 举 拙 的 方式 编写 的 , 因为 我 想 展示 事务 机 制 吓 如 何 工作 的 。 首 移 , 我 
更 新 了 数据 库 里 的 平 末 数 量 。 这 发 生 在 我 检查 检 子 的 数量 之 前 。 这么 做 是 为 了 显示 如 果 事 务 失 败 
它 台 会 被 撤销 。 通 利 情 况 下 ,我 会 暂缓 把 橙子 和 乎 东 数 据 写 回 数据 库 ， 下 到 我 确定 日 己 有 足够 的 
梯子 。 

让 我 们 来 展示 一 下 它 的 实际 工作 情况 。 早 上 ， 农 民 过 来 天 了 550 个 橙子 。 


1> test mnesia:start(). 

ok 

2> test mnesia:reset tabLes( ) . 
{atomic, ok} 

%% 列 出 Shop 表 

3> test mnesia:demo(select shop). 
[{shop,orange, 100,3.80000}, 
{shop,pear, 200,3.60000}, 
{shop,banana, 420,4.50000}, 
{shop,potato, 2456,1.20000}, 
{shop,apple, 20,2.30000}] 

%%6 农民 买 了 50 个 橙子 

%% 支付 了 100 个 苹果 

4> test mnesia:farmer(50). 

{atomic,ok} 

%% 再 次 打印 Shop 表 

5> test mnesia:demo(select shop) . 
[{shop,orange,50,3.80000}, 
{shop,pear, 200,3.60000}, 
{shop,banana, 420,4.50000}, 
{shop,potato, 2456, 1 .20000}, 
{shop,apple, 120,2.30000}1] 


下 午 ， 农 民 想 要 再 天 100 个 橙子 〈 这 家 伙 是 有 多 爱 橙子 啊 )。 


6> test mnesia:farmer(100). 
{aborted,oranges} 
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7> test mnesia:demo(select shop) . 
[{shop,orange, 50,3.80000}, 

{shop, pear, 200,3.60000}, 

{shop, banana, 420,4.50000}, 
{shop,potato, 2456, 1.20000}, 
{shop,apple, 120,2.30000}] 


当 这 个 事务 失败 时 ( 即 调用 mnesia:abort(Reason) 时 ), mnesia:write 所 做 的 更 改 都 被 撤 
销 了 。 正 因为 如 此 ， 数 据 库 恢 复 到 了 进入 事务 之 前 的 状态 。 


20.4.2 ” 载 入 测试 数据 


现在 我 们 已 经 了 解 了 事务 的 工作 原理 ， 下 面 可 以 来 看 看 载 人 测试 数据 的 代码 了 。 
test_mnesia:examptLe_tabtLes/0 函 数 的 作用 是 提供 数据 来 初始 化 各 个 数据 表 。 元 组 的 第 
一 个 元 素 是 表 名 ， 后 面 是 苯 循 原始 记录 定义 顺序 的 表 数 据 。 

















test mnesia.erl 


example tables() -> 
[%% shop 表 
{shop, apple, 20 ， 2.3}, 
{shop, orange, 100, 3.8}, 
{shop, pear, 200, 3.6}, 
{shop, banana, 420, 4.5}, 
{shop, potato, 2456, 1.2}, 
%% COS 七 表 
{cost, apple, ].5}, 
{cost, orange, 2.4}, 
{cost, pear, 2.2}, 
{cost, banana, 1.5}, 
{cost, potato, 0.6} 
] ， 


接 下 来 是 负责 把 来 自 示 例 表 的 数据 插入 Mnesia 的 代码 。 它 所 做 的 就 是 对 examptLe 
tabLes/1 返 回 列表 里 的 每 一 个 元 组 调用 mnesia:write。 

















test mnesia.erl 


reset tables() -> 
mnesia:clear table(shop), 
mnesia:clear table(cost), 
F = fun() -> 
foreach(fun mnesia:write/1, example tables'()) 
end, 
mnesia':transaction(F). 


20.4.3 do() 逊 数 


demo/1 调 用 的 do ( ) 函数 略微 复杂 一 些 。 
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test mnesia.erl 


do(Q) -> 
F = fun() -> qlc:e(Q) end, 
{atomic, Val} = mnesia:transaction(F), 
Val, 


它 在 一 个 Mnesia 事 务 内 调用 了 qtlc:e(Q)。Q 是 一 个 已 编译 的 QLC 查 询 ， 而 qlc:e(Q) 会 执行 
这 个 查询 ， 并 把 碍 询 到 的 所 有 结 东 以 列表 的 形式 返回 。 返 回 值 Tatomic, Val} 的 意思 是 事务 成 功 
并 得 到 了 Vat 值 。Val 是 这 个 事务 函数 的 值 。 


20.5 ”在 表 里 保 存 复杂 数据 


传统 DBMS 的 缺点 之 一 是 在 列 里 保存 的 数据 类 型 数量 有 限 。 你 可 以 保存 一 个 整数 ,一 个 字符 
串 ,一 个 浮 点 数 ， 诸如此类。 但 如 采 想 要 保存 一 个 复 沫 的 对 象 ， 就 会 有 肪 烦 了 。 举 个 例子 ， 如 末 
你 是 一 个 Java 程 序 员 ， 在 SQL 数 据 库 里 保存 一 个 Java 对 象 就 是 非常 麻烦 的 。 

Mnesia 被 设计 用 来 保存 Erlang 的 数据 结构 。 事 实 上 ， 可 以 在 Mnesia 表 里 保存 任何 你 喜欢 的 
Erlang 数 据 结构 。 

为 了 演示 这 一 点 , 我 们 假定 有 许多 建筑 师 想 要 把 他 们 的 设计 保存 在 一 个 Mnesia 数 据 库 里 。 首 
先 必 须 定 义 一 个 记录 来 表示 他 们 的 设计 。 























test mnesia.erl 


-record(design, {id, plan}), 
然后 定义 一 个 给 数据 库 浴 加 设计 的 函数 。 


test mnesia.erl 


add plans() -> 


D1 = #design1{id = {joe,1}, 
plan = {circle,10}}, 
D2 = #designt{id = fred, 
plan = {rectangle, 10,5}}, 
D3 = #design{id = {jane, {house,23}}, 
plan = {house, 
[{floor,1, 
[{doors,3}, 
{windows , 12}, 
{rooms,5S}]}, 
{floor, 2, 
[{doors ,2}, 
{rooms ,4}, 
{windows,15}]}]}}, 
F = fun() -> 


mnesia:write (D1), 
mnesia:write (D2), 
mnesia:write (D3) 
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end, 
mnesia:transaction{F)}). 


现在 可 以 给 数据 库 添加 一 些 设计 了 。 


1> test mnesia:start()., 

ok 

2> test mnesia:add pLans( ) . 
{atomic,ok} 


现在 我 们 的 数据 库 里 有 了 一 些 设计 方案 。 可 以 用 下 面 这 个 访问 函数 来 提取 它们 : 











test mnesia.erl 


get plan(PlanId) -> 
F = fun() -> mnesia:read({design, PlanId}) end, 
mnesia:transaction(F). 


3> test mnesia:get plan(fred). 
{atomic, [{design,fred, {rectangle,10,5}}]} 
4> test mnesia:get plan({jane, {house,23}}). 
{atomic, [{design, {jane, {house,23}}, 
{house, [{floor,1, [{doors,3}, 
{windows, 12}, 
{rooms,S}1}, 
{floor,2,[{doors,2}, 
{rooms ,4}, 
{windows,15}]}]}}]} 
如 你 所 见 ， 数 据 库 的 键 和 提取 出 来 的 记录 都 可 以 是 任意 的 Erlang 数 据 类 型 。 
用 专业 术语 来 说 ,数据 库 里 的 数据 结构 和 编程 语言 里 的 数据 结构 之 间 不 存在 阻抗 失 配 
( impedance mismatch )。 这 就 意味 者 问 数 据 库 插入 和 删除 复杂 的 数据 结构 是 非常 快速 的 。 


20.6 ” 表 的 类 型 和 位 置 


可 以 对 Mnesia 表 进行 多 种 方式 的 配置 。 前 完 ， 表 可 以 位 于 内 存 或 磁盘 里 ( 或 者 两 者 由 有 )。 
其 次 ， 表 可 以 位 于 单 台 机 带 上 ， 也 可 以 在 多 人 台 机 带 之 间 复 制 。 

在 设计 表 时 必须 考虑 到 想 要 保存 在 表 里 的 数据 类 型 。 以 下 是 各 类 表 的 性 质 。 

口 内 存 表 
它们 的 速度 非常 快 ， 但 是 里 面 的 数据 是 多 失 的 ， 所 以 如 果 机 融 关 省 或 者 你 停止 了 DBMS ， 
数据 就 会 丢失 。 

口 磁盘 表 
磁盘 表 应 该 不 会 受到 系统 月 省 的 影响 〈 前提 是 磁盘 没有 物理 损坏 )。 
当 Mnesia 事 务 写 人 一 个 表 并 且 这 个 表 是 保存 在 磁盘 上 时 ， 实 际 上 是 事务 数据 首先 被 写 人 
了 一 个 磁盘 日 志 。 这 个 磁盘 日 志 会 不 断 增 长 ， 里 面 的 信息 会 每 隔 一 段 时 间 与 数据 库 里 的 
其 他 数据 合并 ， 然 后 磁盘 日 志 里 的 条 目 就 会 被 清除 。 如 果 系 统 朋 溃 了 ， 磁 盘 日 志 就 会 在 
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下 一 次 系统 重启 时 进行 一 致 性 检查 ， 任 何 未 合并 的 日 志 条 目 会 先 添 加 到 数据 库 里 ， 然 后 
数据 库 才 可 用 。 任 何 一 个 事务 成 功 时 ， 数 据 和 都 应 该 已 经 正确 写 入 到 磁盘 日 志 里 ， 如 末 系 
统 随后 朋 澳 了 ， 那 么 当 它 下 次 重 忆 时， 事务 所 做 的 改动 应 该 会 完好 无 损 。 
如 采 系 统 在 事务 进行 过 程 中 骨 演 了 了， 那么 它 对 数据 库 所 做 的 改动 应 该 会 于 失 。 
使 用 内 存 表 之 前 , 知 要 做 一 些 试验 来 看 看 物理 内 存 是 否 能 容纳 整个 表 。 如 来 物理 内 存 外 不 下 
内 存 表 ， 系 统 就 会 频 综 读 写 页 面 文 件 ， 这 将 会 影响 性 能 。 
内 存 表 是 易 失 的 ，, 所 以 如 果 想 构建 一 个 容错 式 应 用 程序 , 就 需要 把 内 存 表 复 制 到 磁盘 上 , 或 
者 把 它 复制 为 第 二 人 台 机 带 的 内 存 或 磁盘 表 ， 或 者 两 者 篆 有 。 


















































分 段 表 
Mnesia 支 持 “ 分 段 ” 的 表 ( 用 数据 库 的 行 话说 就 是 水 平分 区 )。 它 被 设计 用 来 实现 极其 巨 
大 的 表 。 这 些 表 被 分 成 许多 片段 ， 然 后 在 不 同 的 机 器 上 储存 。 这 些 片 段 自身 都 是 Mnesia 表 ,就 
像 任何 其 他 的 表 一 样 ， 它 们 可 以 被 复制 ， 可 以 有 索引 ， 诸 如 此 类 。 
更 多 细节 请 参阅 Mnesia 用 户 指南 。 


20.6.1 创建 表 


要 创建 一 个 表 ， 我 们 会 调用 mnesia:create table(Name，ArgS) ， 其 中 Args 是 一 个 由 
{Key, Val} 元 组 构成 的 列表 。 如 果 表 创建 成 功 ，create_table 就 会 返回 {atomic,，ok}， 否 则 返 
回 {aborted，Reason}。 下 面 是 create table 最 常用 的 一 些 参 数 。 








@ Name 
它 是 表 的 名 称 (一 个 原子 )。 按 惯例 它 是 一 个 Erlang 记 录 的 名 称 ， 表 里 的 各 行 是 这 个 记录 
的 实例 。 


® {type, Type} 
它 指定 了 表 的 类 型 。Type 是 set 、ordered set 或 bag 中 的 一 个 。 这 些 类 型 与 19.1 节 里 描 
述 的 类 型 含义 相同 。 

@ {disc copies, NodeList} 
NodeList 是 一 个 Erlang 闻 点 列表 ， 这 些 市 点 将 保存 表 的 磁盘 副本 。 当 我 们 使 用 这 个 选项 
时 ， 系 统 还 会 在 执行 这 个 操作 的 节点 上 创建 一 个 表 的 内 存 副 本 。 
你 可 以 既 在 一 个 节点 上 保存 disc_copies 类 型 的 副本 表 ， 又 在 另 一 个 节点 上 保存 该 表 的 
不 同类 型 。 这 种 做 法 能 满足 以 下 有 要求: 
口 读 取 操作 非常 快 ， 并 在 内 存 里 执行 ; 
口 写 人 操作 在 持久 性 存储 介质 里 执行 。 

@ {ram copies, NodeList} 
NodeList 是 一 个 Erlang 节 点 列表 ， 这 些 节 点 将 保存 表 的 内 存 副 本 。 
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@ {disc only copies, NodeList} 
NodeList 是 一 个 Erlang 点 列表 ， 这 些 市 点 将 只 保存 表 的 磁 副 副本 。 这 些 表 没 有 内 存 副 
本 ,访问 起 来 会 比较 慢 。 

@ {attributes, AtomList} 
这 个 列表 包含 表 里 各 个 值 的 列 名 。 请 注意 ， 要 创建 一 个 包含 Erlang 记 录 xxx 的 表 ， 可 以 用 
{attributes，record info(fieLds，xxx)} 这 种 语法 〈 也 可 以 显 式 指定 一 个 记录 字段 
名 列表 )。 


注意 ”create table 的 选项 比 我 在 这 里 展示 的 更 多 。 所 有 选项 的 细节 请 参阅 mnesia 的 手册 页 。 


20.6.2 ”常用 的 表 属 性 组 合 


假定 下 面 所 有 的 Attrs 都 代表 一 个 {attributes,...} 元 组 。 
这 里 是 一 些 涵盖 了 大 多 数 生 见 情形 的 表 配 置 选项 。 





@ mesia:create table(shop, [Attrs]) 

口 它 会 在 单个 市 点 上 创建 一 个 常 驻 内 存 的 表 。 
口 如 有 果 市 点 朋 演 了 ， 表 就 会 丢失 。 

D 它 是 所 有 表 里 最 快 的 一 种 。 

口 内 存 必须 能 容纳 这 个 表 。 


@ mesia:create table(shop, [Attrs,{disc copies, [node()]1}]) 
口 它 会 在 单个 节点 上 创建 一 个 背 驻 内 存 的 表 和 一 个 磁盘 副本 。 
口 如 果 届 点 朋 沉 了 ， 表 就 会 从 人 磁盘 恢复 。 

口 表 的 读 访 问 很 快 ， 但 写 访 问 较 慢 。 

口 内 存 最 好 能 容纳 这 个 表 。 


@ mesia:create table(shop, [Attrs,{disc only copies, [node()]1}]) 
口 它 只 会 在 单个 节点 上 创建 一 个 磁盘 副本 。 
口 它 用 于 那些 因为 太 大 而 无 法 放 人 内 存 的 表 。 
口 它 的 访问 速度 比 寓 有 内 存 副本 的 方案 更 慢 。 
@ mesia:create table(shop, 
[Attrs, {ram copies, [node(),someOtherNode()})]}) 


口 它 会 在 两 个 节点 上 各 创建 一 个 党 驻 内 存 的 表 。 
D 如 采 两 个 节点 都 朋 涡 了 ， 表 就 会 丢失 。 

口 内 存 必须 能 容纳 这 个 表 。 

口 可 以 在 任何 一 个 节点 上 访问 这 个 表 。 
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@ mesia:create tablel(shop, 
[Attrs, {disc copies, [node(),someOtherNode()]}]) 
口 它 会 在 多 个 节点 上 创建 磁盘 副本 。 
口 无 论 哪个 市 点 朋 当 ,我们 都 能 恢复 过 来 。 
口 即使 所 有 节点 都 朋 泪 了 ， 表 也 不 会 丢失 。 


20.6.3 ” 表 的 行为 


当 一 个 表 被 复制 到 多 个 Erlang 节 点 时 ， 它 会 尽 可 能 远 地 进 行 同 步 。 如 采 某 个 节点 月 尘 了 了 ， 系 
统 仍然 会 正常 工作 , 但 是 副本 的 数量 会 减少 。 当 毅 洗 的 节点 重新 上 线 时 ， 它 会 与 其 他 存 有 副本 的 
万 氮 重 新 进行 同步 。 








注意 ”如果 运 行 Mnesia 的 节点 停止 工作 ，Mnesia 就 可 能 会 过 载 。 如 果 你 使 用 的 笔记 本 电脑 进入 
了 睡眠 ， 那 勾当 它 被 唤醒 时 ，Mnesia 就 可 能 会 暂时 处 于 过 载 状 态 ， 并 生成 许多 警告 消息 。 
我 们 可 以 忽略 这 些 消息 。 


20.7 表 人 查看 器 


要 查看 我 们 保存 在 Mnesia 里 的 数据 ， 可 以 使 用 “observer” 应 用 程序 里 内 建 的 表 查 看 右 。 先 
用 命令 observer:start() 启 动 observer， 然 后 点 击 “Table Viewer”( 表 查 看 需 ) 标签 。 现 在 在 
observer 的 控制 菜单 里 选择 “View”( 查看 ) > “Mnesia Tables”( Mnesia 表 )。 你 会 看 到 一 个 表 的 
清单 ， 如 下 图 所 示 : 





oad Charts | Applications | Processes BV Trace Overview | 


Table Name Table ld Objects Size (kB) Owner Pid Owner Name 
cost <0.41.0> mnesia_monitor 
design <0.41.0> mnesia_monitor 


shop <0.41.0> mnesia_monitor 





点 击 shop 条 日 会 打开 一 个 新 窗口 。 


Record Name item quantity 
shop apple 20 
shop banana 420 
shop orange 100 
shop pear 200 
shop potato 2456 





Objects: 5 





通过 使 用 observer， 你 可 以 查看 表 ， 检 查 系 统 状态 ， 查 看 进程 或 执行 其 他 一 些 操 作 。 
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20.8 ”并 入 挖掘 


希望 现在 你 对 Mnesia 兴 趣 大 增 了 。Mnesia 是 一 种 非常 强大 的 DBMS。 它 从 1998 年 开始 就 补 用 
于 生产 环境 ， 比 如 爱立信 公司 推出 的 许多 高 要 求 电 信 应 用 程序 。 
为 本 书 是 关于 Erlang 而 不 是 Mnesia 的 ， 所 以 我 只 能 给 出 几 种 最 和 常见 的 Mnesia 用 例 。 我 在 这 
一 草 里 展示 的 技巧 都 是 我 月 己 用 过 的 。 我 实际 使 用 (或 理解 ) 的 并 不 比 这 里 展示 的 多 多 少 。 但 是 
通过 向 你 展示 的 这 些 内 容 ， 你 可 以 找到 很 多 乐子 ， 并 能 制作 出 一 些 相当 复杂 的 应 用 程序 。 
我 主要 省 略 了 以 下 这 些 主题 。 
@ 备份 和 恢复 
Mnesia 有 一 系列 的 选项 用 于 配置 备份 操作 ， 可 以 实现 不 同类 型 的 灾难 恢复 。 

@ 及 操作 
Mnesia 人 允许 执行 一 些 脏 (dirty ) 操作 ( dirty read，dirty write，,..)。 它们 是 在 事 
务 环 境 之 外 执行 的 操作 。 这 些 操作 非常 危险 ， 只 有 在 确定 你 的 程序 是 单线 程 的 ， 或 者 处 
于 其 他 特殊 情形 时 才 可 以 使 用 它们 。 使 用 脏 操 作 是 出 于 效率 的 原因 。 

@ SNMP 表 
Mnesia 有 一 个 内 建 的 SNMP 表 类 型 。 它 计 实 现 SNMP 管 理 系 统 变 得 非常 简单 。 

Mnesia 用 户 指南 是 最 权威 的 Mnesia 参 考 资 料 ， 它 可 以 在 Erlang 分 发 套装 的 主 站 里 找到 。 除 此 
之 外 ，Mnesia 分 发 侄 疲 里 的 examples 子 目录 (在 我 的 机 器 上 是 /usr/local/lib/erlang/ 
lib/mnesia-X.Y.Z/examples ) 里 还 有 一 些 Mnesia 范 例 。 

现在 我 们 已 经 完成 了 关于 数据 存储 的 两 草 。 在 下 一 革 里 , 我们 将 来 看 看 调试 、 跟 路 和 性 能 优 
化 的 方法 。 



































20.9 练习 


(1) 假设 你 要 制作 一 个 网 站 ,让 用 户 可 以 提供 优秀 Erlang 程 序 的 消息 。 制 作 一 个 包含 三 个 表 
(users、tips 和 abuse ) 的 Mnesia 数 据 库 来 保存 网 站 需要 的 所 有 数据 。users 表 应 当 保 存 用 户 账 
户 数 据 ( 姓名 、 邮 箱 地 址 和 密码 等 )。tips 表 应 当 保存 关于 实用 网 站 的 消息 (比如 网 站 URL 、 描 
述 和 检查 日 期 等 )。abuse 表 应 当 保 存 采 些 数 据 来 尽量 防止 网 站 滥用 ( 比如 网 站 访客 的 耳 地 址 和 网 
站 访问 次 数 等 数据 )。 

配置 这 个 数据 库 , 让 它 运 行 在 一 台 机 器 上 并 各 有 一 个 内 存 和 磁盘 副本 ,编写 一 些 函 数 来 读 取 、 
写 和 信和 列 出 这 些 表 。 

(2) 继续 上 一 个 练习 ， 但 要 把 数据 库 配置 成 在 两 台 机 器 上 各 有 内 存 和 磁盘 副本 。 尝 试 在 一 人 台 
机 需 上 生成 更 新 并 让 它 骨 溃 ， 然 后 检查 是 否 能 接着 访问 第 二 人 台 机 天 上 的 数据 库 。 

(3) 编写 一 个 查询 来 拒绝 某 个 消息 ， 条 件 是 用 户 在 一 天 内 提交 了 超过 10 条 消息 ， 或 者 最 近 一 
天 从 三 个 以 上 的 IP 地 址 登录 。 

测量 查询 数据 库 所 需 的 时 间 。 

















\ 
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在 这 一 章 里 ， 我 们 将 介绍 一 些 技巧， 你 可 以 用 它们 来 调整 程序 ， 寻 找 bug 并 避免 错误 。 

口 性 能 分 析 〈profiling ) 
用 来 找 出 程序 里 有 哪些 热点 区 域 ， 以 便 进 行 性 能 优化 。 我 认为 光 赁 猜测 来 找 出 程序 的 瓶 
令 儿 乎 是 不 可 能 的 。 最 好 的 做 法 是 先 编写 我 们 的 程序 ， 然 后 确保 它们 是 正确 的 ， 最 后 进 
行 测量 来 找 出 时 间 都 花 在 了 哪里 。 当 然 ， 如 果 程 序 足 够 快 ， 束 可 以 省 去 最 后 这 一 步 。 

口 覆盖 分 析 ( coverage analysis ) 
用 来 统计 程序 里 的 各 行 代 码 分 别 被 执行 了 多 少 次 。 代 码 行 的 执行 次 数 为 零 可 能 意味 看 存 
在 错误 或 者 是 可 以 移 除 的 无 用 代码 。 找 出 频繁 执行 的 代码 行 也 许 能 帮助 你 优化 程序 。 

口 交叉 引用 (cross-referencing ) 
用 来 找 出 是 否 有 遗漏 代码 或 者 谁 调 用 了 什么 。 如 果 试 图 调用 一 个 不 存在 的 函数 ， 交 叉 引 
用 分 析 就 会 检测 出 来 。 这 对 那些 拥有 几 十 个 模块 的 大 型 程序 最 为 有 用 。 

口 编译 器 诊断 信息 
这 一 节 将 对 编译 右 的 诊断 信息 进行 解释 。 

口 运行 时 错误 消息 
运行 时 系统 会 生成 许多 不 同 的 错误 消 且 。 我 们 将 解释 那些 最 常见 的 错误 消 明 的 含义 。 









































口 调试 方法 
调试 内 容 分 为 两 部 分 。 首 和 匈 会 了 解 一 些 向 单 的 技巧 ， 然 后 来 看 Erlang 调 试 硕 。 
口 跟 踊 


我 们 可 以 用 进程 跟踪 来 检查 系统 在 运行 过 程 中 的 行为 。Erlang 有 一 些 高 级 跟踪 工具 ,可 以 
用 来 远程 观察 任意 进程 的 行为 。 还 能 观察 进程 则 的 消息 传递 ， 找 出 进程 内 正在 执行 的 消 
数 ， 观 察 进 程 的 调度 情况 ， 等 等 。 

口 测试 框架 
有 许多 测试 框架 可 以 进行 Erlang 程 序 的 自动 化 测试 。 我 们 将 简要 概述 这 些 框 染 ,并 提供 它 
们 的 获取 方式 。 








21.2 测试 代码 履 盖 281 


21.1 ”Erlang 代码 的 性 能 分 析 工 具 


标准 Erlang 分 发 侄 装 目 币 了 三 种 性 能 分 析 工 具 。 
口 cprof 统 计 各 个 国 数 被 调用 的 次 数 。 它 是 一 个 轻 量 级 的 性 能 分 析 融 , 在 活动 系统 上 运行 它 
会 增加 5% ~ 10% 的 系统 负载 。 
D fprof 显 示 调 用 和 被 调用 师 数 的 时 间 , 结果 会 输出 到 一 个 文件 。 它 适用 于 实验 室 或 模拟 系 
统 里 的 大 型 系统 性 能 分 析 ， 并 会 显著 增加 系统 负载 。 
D eprof 测 量 Erlang 程 序 是 如 何 使 用 时 间 的 。 它 是 fprof 的 前 身 ， 适 用 于 小 规模 的 性 能 分 析 。 
下 面 演示 如 何 运 行 cprof。 我 们 将 用 它 对 17.6 闻 里 编写 的 代码 进行 性 能 分 析 : 











1> cprof:start( ) . %9% 启动 性 能 分 析 器 
4501 

2> shout:start( ) %% 运行 应 用 程序 
<0 .35.0> 

3> cprof:pause(). %% 暂停 性 能 分 析 器 
4844 

4> cprof:analyse(shout). %% 分 析 涵 数 调用 
{shout, 232, 


[{{shout, split,2},73}, 

{{shout,write data,4},33}, 

{{shout,the header,1},33}, 

{{shout,send file,6},33}, 

{{shout,bump,1},32}, 

{{shout,make headerl,1},5}, 
{{shout,'-got request from client/3-fun-0-',1},4}, 
{{shout,songs loop,1},2}, 

{{shout,par connect, 2},2}, 
{{shout,unpack song descriptor,1},1}, 





5> cprof:stop(). %% 停止 性 能 分 析 器 
4865 


另外 ，cprof:anatyse() 会 分 析 所 有 已 收集 统计 数据 的 模块 。 
cprof 的 更 多 细节 可 以 在 网 上 找到 ”。 
fprof2 和 eprof” 大 致 类 似 于 cprof。 要 了 解 更 多 细节 ， 请 查阅 在 线 文档 。 


21.2 测试 代码 敌 震 


我 们 在 进行 代码 测试 时 , 不 光 希 望 了 解 哪些 代码 行 被 频 烷 执行 , 还 和 希望 了 解 哪 些 代 码 行 从 未 
被 执行 。 从 未 执行 的 代码 行 是 潜在 的 错误 来 源 ， 因 此 能 找到 它们 的 位 置 会 很 有 带 助 。 要 做 到 这 一 
点 ， 可 以 使 用 程序 覆盖 分 析 带 。 




















GD http:/www.erlang.org/doc/man/cprof.html 
@) http://www.erlang.org/doc/man/fprof.html 
(3) http://www.erlang.org/doc/man/eprof.html 
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这 里 有 一 个 例子 : 


了 > cover:start(). %5% 局 动 复 盖 分 析 器 
{ok,<0.34.0>} 
2> cover:compile(shout). %% 编译 Shout.erl 来 进行 覆盖 分 析 


{ok, shout} 

3> Shout:start( ) ， 5 上 5 运行 程序 

<0 ,41 .0> 

Playing:<<"title: track018 performer: .. ">> 

4> %85 让 程序 运行 一 段 时 间 

4> cover:analyse to file(shout). 3% 分 析 结 果 
{ok,"shout.COVER.out"} 各 5 这 是 结果 文件 








CN A 一 


| send file(S, Header, OffSet, Stop, Socket, SoFar) -> 
| %36 0ffSet = 要 播放 的 第 一 个 字 节 
| %% Stop 可 以 播放 的 最 后 一 个 字 贡 


L131 | Need = ?CHUNKSIZE - byte size(SoFar), 
Ll | Last = OffSet + Need, 
131.. | if 


Last >= Stop -> 
%%6 数据 不 足 ， 因 此 尽量 续 取 并 返回 


0. 
0..| {ok, Bin} = file:pread(S, OffSet, Max), 
0 


,| Max = Stop - OffSet, 

. | list to binary([SoFar, Bin]); 
| true -> 
131.. | {ok, Bin} = file:pread(S, OffSet, Need), 
3 | write data(Socket, SoFar, Bin, Header), 
131.. | send file(S, bump (Header), 


| OffSet + Need, Stop, Socket, <<>>) 
| end. 








在 文件 的 左 侧 可 以 看 到 各 条 语句 被 执行 的 次 数 。 用 零 标注 的 那些 行 值得 特别 注意 。 因 为 这 些 
代码 未 被 执行 ， 所 以 我 们 无 法 确定 这 个 程序 是 否 正 确 。 








最 佳 测 试 方法 
对 我 们 的 代码 执行 履 盖 分 析 能 回答 一 个 问题 : 哪些 代码 行 从 未 被 执行 过 ? 一 旦 知道 哪些 
代码 行 未 被 执行 ， 就 可 以 设计 测试 案例 来 强制 执行 这 些 代 码 行 。 
要 找 出 程序 里 出 乎 意料 和 隐藏 较 深 的 bug， 这 是 一 个 万 无 一 失 的 做 法 。 每 一 行 从 未 被 执行 
的 代码 都 有 可 能 包含 错误 。 强 制 执行 这 些 代码 行 是 我 所 知道 的 最 佳 程序 测试 方法 。 
我 对 最 初 的 ErlangJAMT 编译 器 就 是 这 么 做 的 。 我 记得 在 两 年 里 只 收 到 了 三 个 bug 报 告 ， 
此 之 后 就 没有 bug 报 告 了 。 


GD JAM 是 Joe’s Abstract Machine (Joe 的 抽象 机 ) 的 缩写 ， 它 是 首 个 Erlang 编 译 髓 。 


™ 
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通过 设计 测试 案例 来 让 所 有 的 上 黎 兰 统 计数 字 大 于 零 是 一 种 很 有 效 的 做 法 ,能够 系统 性 地 找 出 
程序 里 的 隧 藏 缺陷 。 


21.3 生成 交叉 引用 


开发 程序 时 , 可 以 偶尔 对 代码 运行 一 次 交叉 引用 检查 。 如 有 果 有 本 数 缺失 , 在 程序 运行 之 前 就 
能 发 现 它 。 

可 以 用 xref 模 块 来 生成 交叉 引用 。 只 有 当代 码 在 编译 时 设置 了 debug _ info 标识 ，xref 才 能 
正常 工作 。 

我 无 法 癌 你 展示 本 书 所 附 代码 的 xref 输 出 ， 因 为 它们 已 经 开发 完成 ， 不 存在 任何 缺失 的 也 
数 。 不 过 ， 我 会 展示 对 我 的 某 个 业余 项 目 代 码 运行 交叉 引用 检查 会 发 生 什 么 。 

vsg 是 一 个 简单 的 图 形 程序 ， 我 可 能 会 在 未 来 的 某 一 天 发 布 它 。 我 们 将 对 vsg 目 录 里 的 代 人 三 
进行 分 析 ， 这 是 我 用 来 进行 程序 开发 的 目录 。 


$ cd /home/joe/2007/vsg-1.6 

$ rm +*.beam 

$ erlc +debug info +*.erl 

$ erl 

1> xref:d('.'). 

[{deprecated, []}, 

{undefined, [{{new,winl,0}, {wish manager,on destroy,2}}, 
{{vsg,alpha tag,0}, {wish manager,new index,0}}, 
{{vsg,call,1}, {wish,cmd,1}}, 

{{vsg,cast,1}, {wish,cast,1}}, 

{{vsg,mkWindow,7}, {wish,start,Q0}}, 

{{vSsg,new tag,0},{wish manager,new index,0}}, 
{{VvSg,nNew win name,0},{wish manager,new index,O0}}, 
{{vsg,on click,2},{wish manager,bind event,2}}, 
{{VvSg,on move,2}, {wish manager,bind event,2}}, 
{{vSsg,on move,2},{wish manager,bind tag,2}}, 
{{VvSg,on move,2},{wish manager,new index,0}}]}, 
{unused, [{vsg,new tag,O0}, 
{v5sg_indicator box, theValue, 1}, 

{vsg_indicator box,theValue,1}]}] 


xref:d('.') 对 当前 目录 里 所 有 在 编译 时 设置 了 调试 标识 的 代码 执行 了 一 次 交叉 引用 检查 。 
它 生 成 的 列表 包含 了 废弃 ( deprecated )、 未 定义 (undefined ) 和 未 使 用 (unused ) 的 限 数 。 

像 大 多 数 工 具 一 样 ，xref 有 一 大 堆 选 项 ， 所 以 如 果 你 想 充分 利用 这 个 程序 的 强大 功能 ， 就 
必须 去 阅读 手册 。 
































21.4 ”编译 器 诊断 信息 


编译 某 个 程序 时 ， 如果 源 代码 存在 语法 错误 ,编译 从 就 会 同 我 们 提供 有 用 的 错误 消 上 朋 。 这 些 
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消息 大 多 数 都 是 不 言 目 明 的 : 如 朱 漏 掉 了 括号 、 喜 号 或 者 天 键 字 , 编 详 天 就 会 给 出 一 个 错误 消息 ， 
内 含 问 题 语 句 所 在 的 文件 名 和 行 号 。 下 面 是 一 些 我 们 可 能 会 过 到 的 错误 。 





21.4.1 头 部 不 匹配 
如 果 函 数 定义 里 的 各 个 子 句 不 具有 相同 的 名 称 和 元 数 ， 就 会 得 到 以 下 错误 : 


bad.erl 


Line1 foo(1,2) -> 
2 a ; 
3 foo(2,3,a) -> 
4 b ， 


1> c(bad). 
./bad.erl:3: head mismatch 


bad.erl 
Line1 foo(A, B) -> 
2 bar(A, dothis(X), B), 
3 baz (Y, xX). 


1> c(bad). 
./bad.erl:2: variable 'X' is unbound 
./bad.erl:3: variable 'Y' is unbound 


它 的 意思 是 第 2 行 里 的 变量 X 没 有 值 。 这 个 错误 实际 上 不 在 第 2 行 ， 却 是 在 第 2 行 里 检测 到 的 ， 
为 那里 是 未 绑 定 变量 X 首 次 出 现 的 位 置 。( 第 3 行 也 用 到 了 X, 但 是 编 详 带 只 会 报告 错误 首次 出 现 
的 行 。) 


21.4.3 ”未 结束 字符 串 
如 果 我 们 忘 了 给 字符 串 或 原子 加 上 后 引号 ， 就 会 得 到 以 下 错误 消息 ; 


unterminated string starting With ™,.." 


有 了 时候, 找到 缺失 的 引号 可 能 很 困难 。 如 来 你 看 到 这 个 请 奶 但 就 是 找 不 到 哪里 缺 了 引号 , 不 
妨 把 一 个 引号 放 在 你 认为 可 能 是 问题 所 在 的 位 置 附近 , 然后 编 详 程序 。 这 样 也 许 就 能 生成 更 详细 
的 诊断 信息 ， 带 助 你 准确 定位 错误 。 












































21.4.4 ”不 安全 变量 
如 果 我 们 编译 下 列 代 码 : 


bad.erl 
Line1 foo() -> 
2 case bar() of 
3 1 -> 
4 X= 1, 
5 Y = 2; 
6 2 -> 
7 X= 3 
8 end, 
9 b(X). 
就 会 得 到 以 下 警告 
了 > c¢(bad). 
./bad.erl:5: Warning: variable 'Y' is unused 
{ok,bad} 


这 仅仅 是 一 个 警告 ， 因 为 代码 里 定义 了 Y 却 没有 使 用 它 。 如 果 现 在 把 程序 修改 如 下 








bad.erl 
Line1 foo() -> 
2 case bar() of 
3 1 -> 
4 X= 1, 
5 Y = 2; 
6 2 -> 
7 X= 3 
8 end, 
9 D(X Ts 
就 会 得 到 以 下 错误 
> CcC(bad). 
./bad.erl:9: variable 'Y' unsafe in 'case' (line 2) 
{ok, bad} 


编 详 大 推 肝 出 程序 可 能 会 进入 case 表 达 式 的 第 二 个 分 文 《 这 时 变量 Y 是 未 定义 的 )， 因 此 它 
牛 成 了 一 个 “不 安全 变量 ”的 错误 消 朋 。 


21.4.5 ”影子 变量 


影子 变量 ( shadowed variable ) 的 意思 是 某 些 变量 屏蔽 了 之 前 定义 的 其 他 变量 的 值 ， 从 而 使 
你 无 法 使 用 那些 值 。 这 里 有 一 个 例子 : 











bad.erl 


Line1 foo(X, L) -> 
2 lists:map(fun(X) -> 2*X end, L). 
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了 > c(bad). 
./bad.erl:1: Warning: variable 'X' is unused 
/bad.erl:2: Warning: variable 'Xx' shadowed in ‘fun' 
{ok, bad} 
编译 器 担心 我 们 可 能 在 程序 里 犯 了 个 错误 。 我 们 在 fun 里 计算 2*X， 但 指 的 是 哪个 X: 是 作为 
fon 参 数 的 X 还 是 作为 foo 参 数 的 X? 
如 果 发 生 了 这 种 情况 ， 最 好 的 做 法 是 重 命名 其 中 某 一 个 x， 从 而 避免 警告 。 可 以 重新 编写 代 
但 如 下 : 





bad.erl 
foo(X, L) -> 
LiSsts:map(fun(Z) -> 2+Z end, L). 


现在 在 fn 定义 里 使 用 X 就 不 会 有 问题 了 。 


21.5 ”运行 时 诊断 


如 果 某 个 Erlang 进 程 衣 尝 了 ， 我们 可 能 会 得 到 一 个 错误 消息 。 要 看 到 这 个 消息 ， 就 必须 有 别 
的 进程 监视 这 个 月 沉 进程 ， 并 在 它 有 表演 时 打印 出 错误 消息 。 如 果 只 是 用 spawn 创 建 了 一 个 进程 ， 
那么 当 它 月 尝 时 就 不 会 得 到 任何 错误 消息 。 要 想 看 到 所 有 错误 消息 ， 最 好 的 方法 就 是 始终 使 用 


spawn link。 








枝 跟 踩 


每 当 一 个 与 shell 相 连 的 进程 天 省 后 ，shell 就 会 打印 出 栈 跟 踪 信 息 。 为 了 看 到 这 些 信 息 ， 我 们 
将 特意 编写 一 个 人 简单 的 错误 函数 ， 然 后 在 shell 里 调用 它 。 








lib_misc.erl 

deliberate error(A) -> 
bad function{A, 12), 
lists:reverse(A}). 


bad function{(A, ) -> 
{ok, Bin} = file:open({abc,123}, A), 
binary to list (Bin). 


1> Lib misc:deliberate error("file.erl"). 

** exception error: no match of right hand side value {error,badarg} 
in function Llib misc:bad function/2 (lib misc.erl, line 804) 

in call from lib misc:deliberate error/l1 (Lib misc.erl, line 800) 


当 调 用 Lib misc:deliberate error("file.erl") 时 会 产生 一 个 错误 ,随后 系统 会 打印 出 
错误 消息 和 栈 跟 踊 信 息 。 这 个 错误 消息 如 下 : 
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** e@xception error: no match of right hand Slide value {error,badarg} 
它 来 源 于 下 面 这 一 行 : 
{ok, Bin} = file:open({abc,123}, A) 


调用 file:open/2 返 回 了 {error，badarg}， 这 是 因为 {abc,123} 不 是 一 个 合法 的 
file:open 输 入 值 。 当 我 们 试图 用 {ok，Bin} 匹 配 返 回 值 时 ， 就 会 得 到 一 个 不 匹配 错误 ， 运 行 时 
系统 则 打印 出 了 ##k exception error ... {error, badarg}。 

错误 消息 之 后 是 栈 跟踪 信息 。 它 以 发 生 错 误 的 因数 名 开头 , 后 面 是 当前 困 数 完成 后 将 会 返回 
的 各 个 子 数 清单 (包括 函数 名 、 模 块 名 和 行 号 )。 由 此 可 知 ， 人 错误 发 生 在 Lib misc:bad 
function/2 里 ， 而 此 了 消 数 将 会 返回 到 Lib misc:deliberate error/1， 以 此 类 推 。 

请 注意 ,只 有 栈 跟 踪 信 息 顶 部 的 那些 条 目 才 真正 值得 注意 。 如 果 出 错 图 数 的 调用 序列 包含 一 
个 尾 调用 ， 那 它 是 不 会 出 现在 栈 跟 踪 信 息 里 的 。 举 个 例子 ， 如 果 定 义 deliberate error1l 吨 数 
如 下 : 














lib_misc.erl 


deliberate errorl(A) -> 
bad function(A, 12). 


那么 当 我 们 调用 deliberate _ error1 困 数 并 得 到 错误 时 ， 栈 跟踪 信息 里 将 不 会 出 现 这 个 郴 


2> 1ib misc:deliberate errorl("file.erl"). 
** exception error: no match of right hand side value {error,badarg} 
in function lib misc:bad function/2 (lib misc.erl, line 804) 





跟踪 信息 里 没有 deliberate error1 调 用 是 因为 bad function 是 在 deliberate errorl 
的 最 后 调用 的 ， 它 完成 后 不 会 返回 到 deliberate errorl1， 而 是 返回 到 deliberate error1 的 
调用 者 。 

( 这 是 尾 调 用 优化 的 结果。 如 果 某 个 子 数 里 最 后 执行 的 表达 式 是 一 个 孔 数 调用 ,那么 实际 上 
会 被 蔡 换 为 跳跃 。 如 采 没 有 这 种 优化 , 在 消 奶 接收 循环 代码 里 使 用 的 无 限 循 环 编程 模式 就 无 法 实 
现 。 然 而 ,， 正 是 因为 有 了 这 种 优化 ,调用 函数 实际 上 会 在 调用 栈 里 蔡 换 成 被 调用 函数 ， 因 此 在 栈 
跟踪 信息 里 不 可 见 。) 


21.6 ”调试 万 法 


调试 Enlang 代 码 非常 简单 。 你 可 能 会 很 怀 讶 ， 但 这 是 一 次 性 赋值 变量 的 功 务 。 因 为 Erlang 没 
有 指针 或 可 变 状 态 ( ETS 表 和 进程 字典 除外 )， 所 以 通 津 很 容易 找到 问题 的 所 在 。 一 旦 观察 到 某 
个 变量 的 值 不 正确 ， 就 能 相对 容 多 地 找到 发 生 的 时 间 和 地 点 。 

我 发 现 调试 带 在 编写 C 程 序 时 是 一 种 非常 有 用 的 工具 ,因为 我 可 以 让 它 监 视 变 量 并 告诉 我 变 
量 值 何 时 发 生变 化 。 在 很 多 时 候 这 一 点 很 重要 ， 因 为 C 里 的 内 存 可 以 通过 指针 间接 修改 。 你 可 能 
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很 难 知 道 对 茶 一 个 内 存 块 的 修改 来 自 何 处 。 我 不 党 得 Erlang 有 相同 的 调试 硕 需 求 ， 因 为 我 们 不 能 
通过 指针 修改 状态 。 

Erlang 程 序 员 使 用 各 种 各 样 的 方法 来 调试 他 们 的 程序 。 到 目前 为 止 , 最 第 用 的 方法 就 是 给 有 
问题 的 程序 添加 打 纯 语句 。 但 如 果 想 查看 的 数据 结构 变 得 非 党 大， 这 种 方法 就 无 效 了 ,在 这 种 情 
况 下 可 以 把 它们 转 储 到 一 个 文件 ， 留 行将 来 检查 。 

一 些 人 使 用 错误 记录 天 来 保存 错误 消息 ,， 另 一 些 人 则 把 它们 写 和 文件。 如 采 都 实现 不 了 , 还 
可 以 使 用 Erlang 调 试 可 或 者 跟踪 程序 的 执行 过 程 。 让 我 们 来 看 看 这 几 种 方法 。 





























21.6.1 io:format 调 试 


给 程序 添加 打印 语句 是 最 常见 的 调试 形式 。 可 以 简单 地 在 程序 的 关键 位 置 添加 
io:format(...) 语 句 来 打印 出 感 兴趣 的 变量 值 。 

调试 并 行程 序 时 , 一 种 好 的 做 法 是 在 发 送 消息 到 别 的 进程 之 前 先 把 它 打印 出 来 , 收 到 消息 之 
后 也 要 立即 打印 。 

我 在 编写 并 发 程序 时 ， 通 常会 这 样 开始 编 写 接收 循环 : 














loop(...) -> 
receive 
Any -> 
ijo:format("**+* warning uynexpected message:~p~n", [Any]) 
loop(...) 
end. 





随后 , 在 给 接收 循环 添加 模式 的 过 程 中 , 如果 进 程 收 到 任何 无 法 理解 的 消息 ,我 就 会 看 到 打 
印 出 的 警告 消息 。 我 还 会 用 spawn_ Link 人 代替 spawn， 从 而 确保 一 旦 进程 异常 退出 ,错误 消息 就 会 
币 打 印 出 来 。 

我 经 稼 使 用 一 个 宏 : NYI ( “notyet imnplemented” 的 缩写 ， 意 思 是 尚未 实现 )。 它 的 定义 如 下 : 














lib_misc.erl 
-define (NYI(X), (begin 
io:format("*** NYT ~p ~p ~p~n", [?MODULE, ?LINE, X]), 
exit (nyi) 
end)). 


然后 我 就 可 以 像 这 样 使 用 这 个 宏 : 


lib_misc.erl 
glurk(X, Y) -> 
?NYI({glurk, XxX, Y}). 
师 数 gLurk 的 主体 尚未 编写 ， 所 以 当 我 调用 gLurk 时 ， 程 序 就 会 谣 溃 。 


> lib mlisc:gLuUrk(1,2) ， 
*** NYI lib misc 83 {glurk,1,2} 
** exited: nyi * 
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程序 朋 溃 后 显示 了 一 个 错误 消息 ， 这 样 我 就 知道 是 时 候 完 整 实 现 这 个 函数 了 。 


21.6.2” 转 储 至 文件 
如 果 感 兴趣 的 数据 结构 很 大 ， 就 可 以 把 它 写 入 一 个 文件 , 做 法 是 使 用 像 dump/2 这 样 的 函数 。 





lib_misc.erl 

dump(File, Term) -> 
Out = File ++ ".tmp", 
jo:format("** dumping to ~s~n",[Out|]), 
{ok, 5S} = file:open(Out, [write]), 
lo:format(S, "~p.~n",[Term]), 
file:close(S). 


它 会 打印 一 个 警告 消息 来 提醒 我 们 有 新 文件 被 创建 ， 并 给 文件 添加 一 个 ,tmp 扩展 名 〈 这 样 
以 后 就 能 轻松 删除 所 有 的 临时 文件 ) 然后 它 会 把 我 们 感 兴趣 的 数据 类 型 美化 打印 到 一 个 文件 里 。 
可 以 在 以 后 的 某 个 时 间 用 文本 编辑 俘 检 查 该 文件 。 这 个 方法 很 傈 单 , 而 且 特 别 适 合 检查 大 型 的 数 
据 结构 。 








21.6.3 ”使 用 错误 记录 器 


可 以 用 错误 记录 此 来 创建 一 个 保存 调试 输出 的 文本 文件 。 要 做 到 这 一 点 , 我 们 将 创建 一 个 像 
下 面 这 样 的 配置 文件 : 








elog5.config 
%% 文本 错误 日 志 
[ {kernel, 
[{error Logger， 
{file, "/Users/ijoe/error_ logs/debug. Log"}}1}]. 


然后 用 下 列 命 令 启 动 Erlang: 
erl -config elog5.config 


配置 文件 里 指定 的 文件 会 保存 所 有 通过 调用 error Logger 模 块 里 的 函数 所 创建 的 错误 消 
息 ， 以 及 所 有 在 shell 里 打印 出 的 错误 消息 。 


21.7 Erlang 调试 器 


标准 的 Erlang 分 发 套 痛 包含 了 一 个 调试 锅 。 我 不 会 在 这 里 过 多 介绍 它 ， 只 会 告诉 你 如 何 局 动 
它 并 列 出 一 些 文档 地 址 。 局 动 之 后 ,调试 带 的 用 法 很 稍 单 。 你 可 以 检查 节 量 、 单 步 执行 代码 、 设 
置 断 点 或 进行 其 他 操作 。 

因为 我 们 经 常 想 调试 多 个 进程 , 所 以 调试 如 月 身 能 分 作出 许多 副本 , 这 样 我 们 丈 能 看 到 多 个 
调试 窗口 ， 每 个 窗口 对 应 一 个 正在 调试 的 进程 。 
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唯一 的 难点 是 局 动 这 个 调试 前 。 


> %% 重新 编译 Lib misc， 这样 就 能 调试 它 了 
J cf(Lib misc, [debug info]). 

{ok, Llib misc} 

2> 1im(). %% 这 里 会 弹出 一 个 窗口 ， 现 在 可 以 忽略 它 
<0O .42.0> 

3> ii(lib misc). 

{module,lib misc} 

4> laa({[init]). 

true . 

5> Tib misc: 


运行 这 些 命 令 会 打开 图 21-1 所 示 的 窗口 。 


FmoduleClib_misc). 


commonly used routines 


-export([consult/1, 


Step 


Evaluator: 








State: break [lib_mrmisc.erl/D] 
图 21-1 调试 需 初 始 窗口 


可 以 在 调试 带 里 设置 断 点 、 检 碍 变量 或 进行 其 他 操作 。 

所 有 不 市 模块 前 缀 (ii/ 下 1 等 ) 的 命令 都 是 从 模块 里 导出 的 。 它 是 调试 各 /解释 益 接 
口 醒 块 。 这 些 方法 可 以 在 shell 里 特 接 访问 ， 无 需 谎 加 模块 前 绥 。 

我 们 在 司 动 调试 硕 的 过 程 中 调用 了 一 些 困 数 ， 它 们 执行 以 下 任务 。 
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D im() 
启动 一 个 新 的 图 形 监 视 器 , 它 是 调试 器 的 主 窗口 , 会 显示 调试 器 正在 监视 的 所 有 进程 的 状态 。 
D ii(Mod) 


解释 Mod 模 块 里 的 代码 。 
DQ iaa([init]) 
在 执行 已 解释 代码 的 进程 启动 时 让 调试 各 关联 它 。 
要 了 人 解 更 多 关于 调试 的 信息 ， 可 以 试 试 这 些 资源 。 
D http:/www.erlang.org/doc/apps/debugger/debugger.pdf 
这 份 调试 带 参 考 手 册 对 调试 帮 进 行 了 介绍 ， 包 括 屏 送 截 图 和 API 文 档 ， 等 每 。 它 是 调试 硬 
高 级 用 户 的 必 读 文档 。 
DQ http:/www.erlang.org/doc/man/i.html 
在 这 里 能 找到 shell 里 可 用 的 调试 硕 命 令 。 
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无 害 用 特殊 方式 编译 你 的 代码 就 能 跟踪 菏 个 进程 。 跟 躁 一 个 (或 多 个 ) 进程 是 一 种 强 有 力 的 
方式 , 它 既 能 让 你 理解 系统 行为 ,又 能 在 不 改动 代码 的 前 提 下 测试 复 洒 系统 。 它 特别 适用 于 舱 入 
式 系统 ， 或 者 在 无 法 修改 被 测 代码 的 时 候 使 用 。 

可 以 在 底层 调用 一 些 Erlang 内 置 函 数 来 设置 一 个 跟 蹊 。 用 这 些 内 置 函数 设置 复杂 的 跟踪 很 困 
难 ， 所 以 我 们 设计 了 一 些 库 来 让 这 个 任务 变 得 容易 些 。 

我 们 将 从 底层 的 Erlang 内 置 跟踪 六 效 入 手 ， 看 看 如 何 设置 一 个 简单 的 跟踪 从 ， 然 后 展示 能 为 
内 置 跟 躁 函数 提供 更 局 层 接 口 的 库 。 

对 底层 跟 躁 而 言 ， 有 两 个 内 置 函 数 特 别 重要 。erlang:trace/3 的 作用 大 人 臻 是 ，“ 我 想 要 监 
视 这 个 进程 ， 所 以 请 在 发 生 有 意思 的 事 时 给 我 发 一 个 消息 " 。ertang :trace_pattern 则 定义 了 
哪些 算是 “有 意思 ”的 事 。 

DUD erlang:trace(PidSpec, How, FlagList) 

它 会 司 动 跟 踩 。PidSpec 告 诉 系统 要 跟踪 什么 进程 , How 是 一 个 开 居 或 关闭 跟踪 的 布尔 住 ， 
FlagList 指 定 了 要 跟踪 的 事件 ( 比如 ， 可 以 跟踪 所 有 的 函数 调用 ， 跟 踊 所 有 正在 发 送 的 
消息 ， 跟 踩 垃圾 收集 何 时 进行 ， 等 等 )。 

一 旦 调用 了 ertLang:trace/3 这 个 内 置 函 数 , 调用 它 的 进程 就 会 在 跟踪 事件 发 生 时 收 到 跟 
踪 消 息 。 跟 踪 事 件 本 身 是 通过 调用 erlang:trace pattern/3 确 定 的 。 

DQ erlang:trace pattern(MFA, MatchSpec, FlagList) 

它 用 于 设置 一 个 跟踪 模式 。 如 果 模 式 匹 配 ， 请 求 的 操作 就 会 执行 。 这 里 的 MFA 是 一 个 
{ModuLe，Function，Args} 元 组 ， 指 定 要 对 哪些 代码 应 用 跟踪 模式 。MatchSpec 是 一 个 
模式 ， 会 在 每 次 进入 MFA 指 定 的 函数 时 进行 测试 ， 而 FlagList 规 定 了 跟 踊 条 件 满足 时 要 
做 什么 。 
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为 MatchSpec 编 写 匹 配 规则 非常 复杂 ， 对 我 们 理解 跟踪 也 没有 太 大 帮助 。 好 在 有 几 个 库 " 能 
人 够 让 事情 变 得 简单 一 些 。 

可 以 用 之 前 的 两 个 内 置 函 数 编 写 一 个 人 简单 的 跟 踊 磊 。trace_module (Mod，Fun) 会 对 Mod 模 
块 设置 跟踪 ， 然 后 执行 Fun() 。 我 们 想 要 跟踪 Mod 模 块 里 的 所 有 函数 调用 和 返回 值 。 








tracer_test.erl 
trace module(Mod, StartFun) -> 
%%6 分 裂 一 个 进程 来 执行 跟踪 
spawn (fun() -> trace modulel(Mod, StartFun) end ) ， 


trace_ modulel(Mod, StartFun) -> 
%% 下 一 行 的 意思 是 : 跟踪 Mod 里 的 
%% 所 有 函数 调用 和 返回 值 


erlang:trace pattern({Mod, ' ','_'}, 
[{'_',[],[{return trace}]}], 
[Local]), 

%% 分 弄 一 个 孙 数 来 执行 跟 踊 

S = self!(), 


Pid = spawn(fun() -> do trace(S, StartFun) end), 
%% 设置 跟踪 ， 告 诉 系 统 开始 

S%% 跟踪 进程 Pid 

erlang:trace(Pid, true, [call,procs]), 

%% 现在 让 Pid 局 动 

Pid ! {self()}, start}, 

trace Loop(). 


%% do 七 race 会 在 Parent 的 指示 下 
%5% 执行 StartFun() 
do trace(Parent, StartFun) -> 
receive 
{Parent, start} -> 
StartFunt{) 
end. 


%% trace LOoOp 负 责 显示 函数 调用 和 返回 值 
trace loop() -> 
receive 

{trace, ,call, X} -> 
jo:format("Call: ~p~n",[X]), 
trace Loop(); 

{trace, ,return from, Call, Ret} -> 
io:format("Return From: ~p => ~p~n", [Call, Ret]), 
trace loop(); 

Other -> 


(QD http://www.erlang.org/doc/man/ms transform.html 
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各 我 们 得 到 了 其 他 的 一 些 消息 ， 打 印 它 们 
aa ad = ~p~n", [Other]), 
trace loop() 

end. 


现在 定义 一 个 测试 案例 如 下 : 


tracer test.erl 


test2() -> 
trace module(tracer test, fun() -> fib(4) end). 


fib(0) -> 1; 
fib(1) -> 1; 
fib(N) -> fib(N-1) + fib(N-2)., 


然后 就 能 跟 踩 我 们 的 代码 了 。 


1> c(tracer test). 

{ok,tracer test} 

2> tracer test:test2(). 

< .42.0>Call: {tracer test，-trace modulel/2-fun-0- 
[<0 .42.0>,#Fun<tracer test.0.36786085>]} 

Call: {tracer test,do trace,{[<0.42.0>,#Fun<tracer test.0.36786085>]} 
Call: {tracer test,'-test2/0-fun-0-',[]} 

Call: {tracer test,fib,[4]} 

Call: {tracer test,fib,[3]} 

Call: {tracer test,fib,[2]} 

Call: {tracer test,fib,[1]} 

Return From: {tracer test,fib,1} => 1 

Call: {tracer test,fib,[0]} 

Return From: {tracer test,fib,1} => 1 

Return From: {tracer test,fib,1} => 2 

Call: {tracer test,fib,[1]} 

Return From: {tracer test,fib,1} => 1 

Return From: {tracer test ,fib,1} => 3 

Call: {tracer test,fib,[2]} 

Call: {tracer test,fib,[1]} 

Return From: {tracer test,fib,1} => 1 

Call: {tracer test,fib,[0]} 

Return From: {tracer test ,fib,1} => 1 

Return From: {tracer test ,fib,1} => 2 

Return From: {tracer test,fib,1} => 5 

Return From: {tracer test,'-test2/0-fun-0-',0} => 5 
Return From: {tracer test,do trace,2} => 5 

Return From: {tracer test,'-trace modulel/2-fun-0-',2} => 5 
Other = {trace,<0.43.0>,exit,normal} 


民 蹊 从 的 输出 可 能 会 极其 详细 , 对 理解 程序 的 动态 行为 很 有 价值 。 阅读 代码 能 市 给 我 们 前 态 
是 但 观察 消息 流 能 让 我 们 看 到 系统 动态 行为 的 景 
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使 用 跟踪 库 
可 以 用 库 模块 dbg 来 执行 与 之 前 相同 的 跟踪 。 它 会 隐藏 抵 层 Erlang 内 置 也 数 的 所 有 细 方 。 





tracer test.erl 


test1() -> 
dbg:tracer(), 
dbg:tpl{tracer test,fib,' ', 
dbg:fun2ms (fun( ) -> return trace() end)), 
dbg:p(all, [c]), 
tracer test:fib{(4). 


运行 它 会 得 到 以 下 输出 : 


1> tracer test:test1(). 

(<0.34.0>) call tracer test:fib(4) 

(<0.34.0>) call tracer test:fib(3) 

(<0.34.0>) call tracer test:fib(2) 

(<0.34.0>) call tracer test:fib(1) 

(<0.34.0>) returned from tracer test:fib/l1 -> 1 
(<0.34.0>) call tracer test:fib(O) 

(<0.34.0>) returned from tracer test:fib/l1 -> 1 
(<0.34.0>) returned from tracer test:fib/l1 -> 2 
(<0.34.0>) call tracer test:fib(1) 

(<0 .34.0>) returned from tracer test:fib/l1l -> 1 
(<0.34.0>) returned from tracer test:fib/l1l -> 3 
(<0 ,34.0>) call tracer test:fib(2) 

(<0.34.0>) call tracer test:fib(1) 

(<0.34.0>) returned from tracer test:fib/l1 -> 1 
(<0.34.0>) call tracer test:fib(0) 

(<0.34.0>) returned from tracer test:fib/l1 -> 1 
(<0.34.0>) returned from tracer test:fib/l1 -> 2 
(<0.34.0>) returned from tracer test:fib/1 -> 5 


这 里 用 库 代码 而 不 是 内 置 跟 踪 也 数 实现 了 前 一 方 的 操作 。 要 实现 细 粒 度 的 控制 , 多 半 应 该 用 
内 置 跟踪 函数 来 编写 自己 的 自 定义 跟 踊 代码。 要 进行 快速 试验 ， 库 代码 就 够 用 了 。 

要 了 解 更 多 有 关 跟 踩 的 信息 ， 你 需要 阅读 以 下 三 个 模块 的 手册 页 。 

口 dbg 提 供 了 Erlang 内 置 跟 踩 吨 数 的 简化 接口 。 

D ttb 是 内 置 跟踪 国 数 的 另 一 种 接口 ， 比 dbg 更 高 层 。 

口 ms_transform 能 生成 用 于 跟踪 软件 的 匹配 规则 。 














21.9 Erlang 代码 的 测试 框 染 


应 该 为 复杂 的 项 目 设立 一 个 测试 框架 ,并 把 它 集 成 到 你 的 构建 系统 里 。 如 果 有 兴趣 ,可 以 探 
索 一 下 下 面 这 两 个 框架 。 
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口 通用 测试 框架 
通用 测试 框 染 ( Common Test Framework ) 是 Erlang/OTP 分 发 僚 闪 的 一 部 分 。 它 提供 了 一 
套 完 整 的 工具 来 进行 日 动 化 测试 ,通用 测试 框架 被 用 来 测试 Erlang 分 发 登 装 本 里 以 及 爱 立 
信 公 司 的 许多 产品 。 
口 基于 属性 的 测试 
基于 属性 的 测试 相对 比较 新 ， 它 是 一 种 极其 优秀 的 技巧 ， 能 够 拌 洲 出 代码 里 难以 发 现 的 
bug。 我 们 不 需要 编写 测试 案例 ， 而 是 用 一 种 谓词 逻辑 ( predicate logic ) 形式 来 描述 系统 
的 各 个 属性 。 测 试 工具 会 生成 符合 系统 属性 的 随机 测试 案例 ， 然 后 检查 这 些 属性 是 否 会 
出 现 违规 。 
有 两 个 基于 属性 的 工具 可 以 用 来 测试 Erlang 程 序 : 一 个 是 QuickCheck ， 它 是 一 家 名 为 
Quviq 的 瑞典 公司 推出 的 商业 性 程序 ， 男 一 个 是 proper”， 它 的 灵感 来 源 于 QuickCheck。 
祝贺 你 ! 现在 你 已 经 了 解 了 如 何 编写 顺序 和 并 发 程序 ， 了 解 了 文件 和 和 套 接 字 、 数 据 存 储 和 数 
据 库 ， 以 及 如 何 调试 和 测试 程序 。 
在 下 一 曹 里 , 我 们 将 换 一 个 话题 , 来 讨论 开放 电信 平台 (Open Telecom Platform, 简称 OTP )。 
这 个 古怪 的 名 字 反 映 了 了 Erlang 的 历史 。OTP 是 一 个 应 用 程序 框 染 ， 或 者 说 一 组 编程 模式 ， 它 能 简 
化 分 布 式 容错 系统 的 编码 工作 。 这 个 久 经 考验 的 框架 已 被 大 量 应 用 程序 使 用 , 所 以 把 它 用 于 你 上 自 
己 的 项 目 是 一 个 很 好 的 起 点 。 
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(1) 创建 一 个 新 目录 ， 然 后 复制 标准 库 模 块 dict .er1l 到 这 个 目录 里 。 给 dict .erl 添 加 一 个 
错误 ， 使 它 在 某 一 行 代 码 被 执行 时 会 前 泪 。 然 后 编译 这 个 模块 。 

(2) 现在 我 们 有 了 一 个 问题 模块 dict， 但 多 半 还 不 知道 它 有 问题 ， 所 以 需要 引发 错误 。 编 写 
一 个 简单 的 测试 模块 来 用 多 种 方式 调用 dict， 看 看 能 否 让 dict 和 月 尝 。 

(3) 使 用 覆盖 分 析 器 来 检查 dict 里 的 每 一 行 代码 各 被 执行 了 多 少 次 。 给 你 的 测试 模块 添加 更 
多 的 测试 案例 ， 看 看 是 否 履 盖 了 dict 里 的 所 有 代码 。 这 么 做 的 目的 是 确保 dict 里 的 每 一 行 代 码 
都 被 执行 。 一 旦 知道 哪些 代码 行 未 被 执行 ， 就 能 轻松 进行 反 回 推导 , 找 出 测试 案例 里 的 哪些 代码 
行 能 导致 某 一 行 原 代码 被 执行 。 

坚持 做 这 件 事 ,直到 程序 前 省 为 止 。 表 省 迟早 会 发 生 , 因为 当 每 一 行 代 人 码 都 被 覆盖 时 ， 就 意 
味 着 错误 已 被 触发 。 

(4) 现在 我 们 有 了 一 个 错误 。 假 闭 你 不 知道 错误 出 在 哪里 ， 然 后 使 用 这 一 童 里 介绍 的 方法 来 
找 出 这 个 错误 。 

当 你 真 的 不 知道 错误 在 哪里 时 ,这 个 练习 会 更 有 效 。 找 个 朋友 来 破坏 你 的 某 些 模块 ,然后 对 
这 些 模块 运行 窗 盖 测试 来 引发 错误 。 一 旦 引发 了 错误 ， 就 使 用 调试 技术 来 找 出 问题 所 在 。 






































GD http://www.quviq.com 
@) https://github.com/manopapad/proper 








OTP 介 绍 





OTP 代 表 Open Telecom Platform ( 开放 电信 平台 )。 这 个 名 字 其 实 有 一 些 误导 性 ， 因 为 OTP 
比 你 想象 的 要 通用 得 多 。 它 是 一 个 应 用 程序 操作 系统 ,包含 了 一 组 库 和 实现 方式 ,可 以 构建 大 规 
模 、 容 错 和 分 布 式 的 应 用 程序 。 它 由 瑞典 电信 公司 爱立信 开发 ， 在 爱立信 内 部 用 于 构建 容错 式 系 
统 。 标 准 的 Erlang 分 发 套装 包含 OTP 库 。 

OTP 包 含 了 许多 强大 的 工具 ， 例 如 一 个 完整 的 Web 服 务 古 ， 一 个 FTP 服 务 右 和 一 个 CORBA 
ORB" 等 , 它们 全 都 是 用 Erlang 编 写 的 。OTP 还 包含 了 构建 电信 应 用 程序 的 最 先进 工具 , 能够 实现 
H248、SNMP 和 ASN.1/Erlang 交 又 编译 带 ( 这 些 是 电信 行业 里 常用 的 协议 )。 我 不 会 在 这 里 讨论 它 
们 ， 你 可 以 在 Erlang 网 站 ?> 上 找到 和 这 些 主题 相关 的 大 量 信息 。 

如 果 想 用 OTP 编 写 自 己 的 应 用 程序 ,你 会 发 现 一 个 很 有 用 的 核心 概念 是 OTP 行 为 。 行为 封装 
了 常见 的 行为 模式 ， 你 可 以 把 它 看 作 是 一 个 用 回调 函数 作为 参数 的 应 用 程序 框架 。 

OTP 的 威力 来 自 于 行为 本 身 就 能 提供 容错 性 、 可 扩展 性 和 动态 代码 升级 等 属性 。 换 句 话说 ， 
回调 国 数 的 编写 者 不 必 担 心 容 错 之 类 的 事情 ， 因 为 行为 已 经 提供 了 它们 。 康 悉 Java 的 读者 可 以 把 
行为 看 作 是 一 个 J2EE 容 妖 。 

简单 地 说 , 行为 负责 解决 问题 的 非 函 数 部 分 , 而 回调 孔 数 负责 解决 函数 部 分 。 这么 做 的 优点 
在 于 问题 的 非 孙 数 部 分 (比如 如 何 进行 实时 代码 升级 ) 对 所 有 应 用 程序 都 是 一 样 的 ， 而 孔 数 部 分 
(由 回调 函数 提供 ) 在 每 个 问题 里 都 是 不 同 的 。 

在 这 一 曹 里 ， 我 们 将 非常 详细 地 介绍 其 中 一 种 行为 : gen_server 模 块 。 但 是 ， 在 深入 
gen server 工 作 方 式 的 核心 细 市 之 前 ， 首 先 会 从 一 个 简单 的 服务 如 ( 我们 能 想象 的 最 简单 的 服 
务 器 ) 和 人手， 然后 一 步 步 改 进 它 ， 直 到 实现 gen server 模 块 的 完整 功能 。 这 样 你 就 能 切实 理解 
gen_server 是 如 何 工 作 的 ， 并 为 深入 探索 做 好 准备 。 

本 章 的 规划 如 下 。 

(1) 用 Erlang 编 写 一 个 客户 端 -服务 天 小 程序 。 

(2) 慢 慢 让 这 个 程序 通用 化 ， 并 添加 一 些 特性 。 

(3) 转向 真正 的 代码 。 



























































GD http://en.wikipedia.org/wiki/Common Object Request Broker Architecture 
@) http://www.erlang.org/ 


22.1 通用 服务 器 之 路 


这 是 整 本 书 里 最 重要 的 一 节 ， 所 以 请 读 一 遍 ， 再 读 两 遍 ， 黄 至 读 一 百 遍 ， 确 保 你 能 完全 理解 
里 面 的 内 容 。 

这 一 节 是 关于 构建 抽象 的 ， 我们 将 看 到 一 个 名 为 gen server.erL 的 服务 吕 。gen server ( 通 
用 服务 各 ) 是 OTP 系 统 里 最 常用 的 抽象 ， 但 很 多 人 从 来 没有 深入 探寻 过 gen server.erl 是 如 何 
工作 的 。 一 旦 理解 了 gen server 是 如 何 构建 的 ， 就 能 重复 这 个 抽象 过 程 来 构建 自己 的 抽象 。 

我 们 将 编写 四 个 小 小 的 服务 器 : serverl1、server2 、server3 和 server4， 每 一 个 服务 器 
都 与 上 一 个 稍 有 不 同 。server4 会 类 似 于 Erlang 分 发 套装 里 的 gen server。 我 们 的 目标 是 把 问题 的 
非 浮 数 部 分 与 函数 部 分 完全 分 开 。 这 人 句 话 现在 也 许 对 你 没有 什么 意义 , 但 是 请 别 担心 ， 很 快 就 会 
有 了 。 深 呼吸 1 











22.1.1 Server 1: 基本 的 服务 器 
以 下 代码 是 我 们 的 首次 党 试 。 它 是 一 个 小 小 的 服务 器 ， 可 以 用 回调 模块 作为 它 的 参数 。 








server1.er| 


-module(serverl). 
-export([start/2, rpc/21). 
start(Name, Mod}) -> 
reglister(Name, spawn(fun() -> loop(Name, Mod, Mod:init()) end)). 
rpc(Name, Request) -> 
Name ! {self(), Request}, 


receive 
{Name, Response} -> Response 
end ， 
loop(Name, Mod, State) -> 
receive 


{From, Request} -> 
{Response, Statel} = Mod:handle(Request, State), 
From ! {Name, Response}, 
loop(Name, Mod, Statel) 
end. 


这 一 小 段 代 码 凝 聚 了 服务 带 的 精华 。 下 面 我 们 给 server1 编 写 一 个 回调 模块 ， 它 是 一 个 名 称 
服务 硕 回 调 模块 : 


name_server.erl 

-module(name server). 

-export([init/0, add/2, find/1, handle/21). 
-import(serverl, [rpc/2]). 


sb ~ 


55 客户 庚 方法 


oP 
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add(Name, Place) -> rpc(name server, {add, Name, Place}). 
find(Name) -> rpc(name server, {find, Name}), 


%% 回调 方法 

init() -> dict:new!(). 

handle({add, Name, Place}, Dict) -> {ok, dict:store(Name, Place, Dict)})}; 

handle({find, Name}, Dict) -> {dict:find(Name, Dict), Dict}. 

这 段 代码 实际 上 执行 两 个 任务 。 它 首先 充当 被 服务 如 框 架 代 人 码 调用 的 回调 模块 ， 与 此 同时 ， 
它 还 包含 了 将 被 客户 端 调用 的 接口 方法 。OTP 的 惯例 是 把 这 两 类 冰 数 放 在 同一 个 模块 里 。 

为 了 证 明 它 能 工作 ， 你 可 以 这 人 么 做 : 

1> serverl:start(name _ server，nanme_sSserver ) ， 

true 

2> name server:add(joe, "at home"). 

Ok 


3> name server:find(]joe). 
{ok,"at home"} 


现在 停 下 来 想 一 想 。 这 个 回调 模块 没有 用 于 并 发 的 代码 ， 没 有 分 错 ， 没 有 发 送 ， 没 有 接收 ， 
也 没有 注册 。 它 是 纯粹 的 顺序 代码 ， 别 无 其 他 。 这 就 意味 看 我 们 可 以 在 完全 不 了 解 底 层 并 发 模型 
的 情况 下 编写 客户 痪 -服务 从 模型 。 

这 就 是 所 有 服务 大 的 基本 模式 。 一 旦 理解 了 基本 的 结构 , 就 可 以 轻 轻 松 松 地 “ 目 主 人 研发” 了。 
































22.1.2 Server 2: 实现 事务 的 服务 器 


这 个 服务 上 冀 会 在 查询 产生 寞 第 错误 时 让 客户 器 朋 演 : 








server2.erl 


-module(server2). 
-export([start/2, rpc/21). 


start(Name, Mod) -> 
register (Name, spawn(fun() -> loop(Name,Mod,Mod:init()) end)). 


rpc{Name, Reguest) -> 
Name ! {setlf(), Request}, 
receive 
{Name, crash} -> exit(rpc); 
{Name, ok, Response} -> Response 
end. 


loop(Name, Mod, OldState) -> 
receive 
{From, Reqyuest} -> 
try Mod:handle(Request, OldState) of 
{Response, NewState} -> 


From ! {Name, ok, Response}, 
loop(Name, Mod, NewState) 

catch 

_:Why -> 

log the error(Name, Request, Why), 
%% ,发送 一 个 消息 来 让 客户 茹 衣 渍 
From ! {Name, crash}, 
%% 以 *# 初 始 # 状 态 继续 御 环 
loop(Name, Mod, OldState) 

end 

end ， 


log the error(Name, Request, Why) -> 
io:format("Server ~p reguest ~p -~ 站 
"Caused exception ~p~n", 
[Name, Request, Why]). 
这 段 代码 在 服务 融 里 实现 了 “事务 语义 ”， 它 会 在 处 理 函 数 抛 出 异 稼 错误 时 用 State ( 状态 ) 
的 初始 值 继续 循环 。 但 如 果 处 理 函 数 成 功 了 ， 它 就 会 用 人 处理 函数 提供 的 NewState 值 继续 循环 。 
当 处 理 函 数 失 败 时 ,服务 硕 会 给 发 送 问题 消息 的 客户 闪 发 送 一 个 消息 ,让 它 关 法 。 这 个 客户 
闪 不 能 继续 工作 , 因为 它 发 送 给 服务 需 的 请 求 导致 了 处 理 冰 数 的 朋 溃 , 但 其 他 想 要 使 用 服务 需 的 
客户 闪 不 会 受到 影响 。 另 外 ， 当 处 理 冰 数 发 生 错 误 时 ， 服 务 帝 的 状态 不 会 改变 。 
请 注意 ， 这 个 服务 器 使 用 的 回调 模块 和 用 于 server1 的 回调 模块 一 模 一 样 。 通 过 修改 服务 器 
并 保持 回调 模块 不 变 ， 我 们 就 能 修改 回调 模块 的 非 函数 行为 。 














注意 ”最 后 那 句 话 并 不 完全 正确 。 从 Server1 转 到 server2 时 ， 我 们 必须 对 回调 模块 做 一 点 小 小 
的 改动 ， 也 就 是 把 -Import 声明 里 的 server1 改 成 Server2。 除 此 之 外 并 无 其 他 改动 。 


中 


22.1.3 Server 3: 实现 热 代 码 交 换 的 服务 


现在 我 们 将 添加 热 代 码 交 换 ( hot code swapping ) 功能 。 大 多 数 服务 需 都 执行 一 个 固定 的 程 
序 ， 如 采 要 修改 服务 融 的 行为 ， 就 必须 先 停 止 服 务 闫 ， 再 用 修改 后 的 代码 重 司 它 。 而 要 修改 这 个 
服务 妖 的 行为 ,不 用 停止 它 ， 只 需要 发 送 一 个 包含 新 代码 的 消息 ， 它 就 会 提取 新 代码 ， 然 后 用 新 
代码 和 老 的 会 话 数据 继续 工作 。 这 一 过 程 被 称 为 热 代码 交换 。 








server3.erl 


-module(server3). 
-export([start/2, rpc/2, swap_code/2]). 
start{Name, Mod)} -> 
register (Name, 
spawn{(fun{() -> loop(Name,Mod,Mod:init{()}) end)). 
swap code(Name, Mod) -> rpc{({Name, {swap code, Mod}). 
rpc{({Name, Request) -> 





Name ! {self(), Request}, 


recelve 
{Name, Response} -> Response 
end. 
loop(Name, Mod, OldState) -> 
receijve 


{From, {swap code, NewCallBackMod}} -> 
From ! {Name, ack}, 
loop(Name, NewCallBackMod, OldState),; 

{From, Request} -> 
{Response, NewState} = Mod:handle(Request, OldState), 
From ! {Name, Response}, 
loop(Name, Mod, NewState,) 

end ， 


ns 它 就 会 把 回调 模块 改 为 消息 里 包含 的 新 模块 。 

我 们 可 以 演示 这 一 点 ， 做 法 是 用 某 个 回调 模块 启动 server3， 然后 动态 交换 这 文 个 回调 模块 。 
不 能 用 name_ ey 因为 服务 需 名 已 经 被 便 编 译 进 这 个 模块 里 了 。 因 此 ,将 制作 
一 个 名 为 name_server1 的 副本 ， 然 后 在 里 面 修改 服务 硕 的 名 称 。 


name _server1.er| 

-module(name server1) ， 

-export( [init/0, add/2, find/l1, handle/21). 
-import(server3, [rpc/2]). 


%% 客 尸 萝 万 法 
add(Name, Place) -> rpc(name server, {add, Name, Place}). 
find (Name) -> rpc(name server, {find, Name}). 


%5% 回调 方法 
init() -> dict:new!(). 


handle({add, Name, Place}, Dict) -> {ok, dict:store(Name, Place, Dict)}; 
handle({find, Name}, Dict) -> {dict:find(Name, Dict), Dict}. 


首先 将 用 回调 模块 name serverl 启 动 server3。 


1> server3:start(name server, name serverl). 


true 

2> name serverl:add(joe, "at home"). 
ok 

3> name serverl:add(helen, "at work"). 
ok 


现在 假设 想 要 找 出 这 个 名 称 服务 问 能 提供 的 所 有 和 名称 。API 里 没有 隆 数 能 做 到 这 一 点 ， 因 为 
name server 模 块 只 包含 访问 函数 add 和 find。 
于 是 我 们 以 闪电 般 的 速度 打开 文本 编辑 硕 并 编写 一 个 新 的 回调 模块 。 





new_name_server.erl 


-MmOodule (new name server). 
-export([init/0, add/2, all names/0, delete/1, find/1, handle/21). 
-import(server3, [rpc/21). 


%% 接口 

all names() -> rpc(name server, allNames). 

add(Name, Place) -> rpc(name server, {add, Name, Place})., 
delete (Name) -> rpc(name server, {delete, Name}). 
find (Name) > rpc(name server, {find, Name}). 

5 省 回调 方法 

init() -> dict:new!(). 


handle({add, Name, Place}, Dict) - 
handle(allNames, Dict) 
handle({delete, Name}, Dict) 
handle({find, Name}, Dict) 


编 详 这 个 模块 并 告知 服务 俘 交 换 它 的 回调 模块 。 


4> Cnew name _ Server ) ， 

{ok,new name server} 

5> Server3:Swap code(name server, new name server). 
ack 


现在 就 可 以 运行 服务 硕 里 的 新 函数 了 。 

6> new name _ server :atLL names( ) . 

[joe,helen] 

我 们 在 这 里 实时 更 换 了 回调 模块 ， 这 就 是 动态 代码 升级 ， 束 发 生 在 你 的 眼 丽 ,没有 什么 黑 
Le 

现在 再 停 下 来 想 一 想 。 之 前 完成 的 两 个 任务 通常 都 被 认为 很 有 难度 , 事实 的 确 如 此 。 编写 能 
实现 “事务 语义 ”的 服务 各 很 困难 ,编写 能 实现 动态 代码 升级 的 服务 右 也 很 困难 ,但 这 个 方法 让 
它们 变 得 简单 了 。 

这 个 方法 极其 强大 。 传统 上 我 们 认为 服务 硕 是 有 状态 的 程序 , 当 我 们 回 它 发 送 消息 时 会 改变 
它 的 状态 。 服 务 冀 里 的 代码 在 首次 调用 时 就 固定 了 ， 如 果 想 要 修改 服务 益 里 的 代码 ， 就 必须 集 止 
服务 从 并 修改 代码 ， 然 后 重 局 服 务 硕 。 在 前 面 的 例子 中 ,修改 服务 着 的 代码 就 像 修改 服务 天 的 状 
态 那 样 简单 。 我 们 用 这 个 方法 编写 了 许多 产品 ， 它 们 从 来 不 会 因为 软件 维护 升级 而 俘 止 服务 。 


{ok, dict:store(Name, Place, Dict)}, 
{dict:fetch keys(Dict), Dict}; 
{ok, dict:erase(Name, Dict)}; 


> 
-> 
-> 
> {dict:find(Name, Dict), Dict}., 
































22.1.4 Server 4: 事务 与 热 代 码 交 换 


在 前 两 个 服务 硕 里 ， 代 码 升 级 和 事务 语义 是 分 开 的 。 现 在 我 要 把 它们 组 合 到 一 个 服务 需 里 。 
好 戏 开 始 了 。 
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server4.erl 


-module(server4)., 
-export( [start/2, rpc/2, swap code/2]). 


start(Name, Mod) -> 
register(Name, spawn (fun() -> loop(Name,Mod,Mod:init()) end)). 
swap_code (Name, Mod) -> rpc(Name, {Swap _ code, Mod}). 
rpc(Name, Request) -> 
Name ! {self()}, Request}, 
receive 
{Name, crash} -> exit(rpc); 
{Name, ok, Response} -> Response 
end ， 


loop(Name, Mod, OldState) -> 
receive 
{From, {swap code, NewCallbackMod}} -> 
From ! {Name, ok, ack}, 
loop(Name, NewCallbackMod, OldState); 
{From, Request} -> 
try Mod:handle(Request, OldState) of 
{Response, NewState} -> 
From ! {Name, ok, Response}, 
loop(Name, Mod, NewState) 


catch 
Why -> 
log the error(Name, Request, Why), 
From ! {Name, crash}, 
loop(Name, Mod, OldState) 
end 


end. 


log the error(Name, Request, Why) -> 
lo:format("Server ~p request ~p ~Nn" 
"Caused exception ~p~n", 
[Name, Request, Why]), 


这 个 服务 需 同 时 提供 了 热 代 码 交 换 和 事务 语义 ， 王 净利 落 ! 
22.1.5 Server 5: 更 多 乐趣 


理解 动态 代码 变换 的 概念 之 后 ,我们 就 能 找到 更 多 乐趣 。 这 里 有 一 个 服务 肯 ， 它 不 会 做 任何 
事 ， 下 到 你 通知 它 变 成 菏 一 种 类 型 的 服务 珊 : 


Server5.er| 

-module(servers), 

-export([start/0, rpc/2]). 

start() -> spawn(fun() -> wait() end). 


wait() -> 
receive 
{become, F} -> F() 
end, 
rpc(Pid, Q) -> 
Pid ! {self(), Q}, 
receive 
{Pid, Reply} -> Reply 
end. 


如 琳 局 动 它 并 癌 它 发 送 一 个 {become，F} 消 恩 ， 它 就 会 变 成 一 个 执行 F( ) 函数 的 F 服 务 带 。 


1> Pid = server5:start(). 
< ,57 ,0> 


我 们 的 服务 带 不 做 任何 事 ， 只 是 在 等 每 一 个 become 消 乱 。 
现在 来 定义 一 个 服务 带 函 数 。 没 什么 复 森 的 ， 只 是 计算 阶乘 而 已 。 














my_fac_server.erl 


-module(my fac server)., 
-export([Loop/0]). 


loop() -> 
receive 
{From, {fac, N}} -> 
From ! {self(), fac(N)}, 





loop(); 
{become, Something} -> 
Something() 
end . 
fac(9) -> 1; 


fac(N) -> N * fac(N-1)., 
确保 它 成 功 编 译 之 后 ， 就 可 以 通知 进程 <0.57.0> 变 成 一 个 阶乘 服务 顺 了 。 


2> Cnmy fac _ server ) ， 

{ok,my_fac server} 

3> Pid ! {become, fun my fac server:loop/0}. 
{become,#Fun<my fac server.,loop.0>} 


现在 这 个 进程 已 经 变 成 一 个 阶乘 服务 从 了 ， 我 们 来 调用 它 。 


4> server5:rpc(Pid, {fac,30}). 
265252859812191058636308480000000 


这 个 进程 会 一 直 扮 演 阶 乘 服务 需 的 角色 ， 直 到 回 它 发 送 一 个 {become，Something}+ 消 息 来 
告诉 它 做 点 别 的 什么 。 
正如 你 在 前 面 这 些 例子 中 所 看 见 的 , 我 们 可 以 制作 各 种 不 同类 型 的 服务 咒 , 让 它们 具有 不 同 
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的 语义 和 一 些 相当 尺 人 的 属性 。 这 个 方法 实在 是 太 过 强大 ， 如 果 彻 奔 发 挥 它 的 次 力 ,就 能 生成 拥 
有 慰 人 威力 和 美感 的 小 程序 。 如 打 我 们 的 项 目 是 工业 规模 的 , 涉及 成 百 上 千 个 程序 员 , 或 许 并 不 
想 让 事情 过 于 动态 。 既 要 兼顾 通用 性 和 威力 ， 又 要 满足 商业 产品 的 需要 。 让 代码 能 在 运行 时 更 换 
新 版 这 一 点 很 美好 , 但 之 后 如 果 出 了 错 则 会 成 为 调试 者 的 黑 梦 。 如 有 果 数 十 次 动态 改动 代码 ， 而 它 
随后 骨 尝 了， 那么 找 出 准确 的 错误 原因 可 不 是 一 件 容易 的 事 。 








PlanetLab 里 的 Erlang 
几 年 前 ， 当 我 还 在 做 研究 的 时 候 ， 曾 经 与 PlanetLab 一 起 共事 。 我 能 访问 PlanetLab 网 络 ( 它 
是 一 个 全 球 范 围 的 研究 网 络 : http://www.planet-lab.org )， 所 以 我 在 PlanetLab 的 所 有 (大 约 450 
台 ) 机 器 上 都 安装 了 “空白 ”的 Erlang 服 务 器 。 当 时 我 并 不 知道 要 拿 这 些 机 器 来 做 什么 ， 因 此 
只 是 设立 了 服务 器 架构 以 供 将 来 使 用 。 


让 这 层 架 构 运行 起 来 之 后 ， 我 很 容易 就 能 向 这 些 空白 服务 器 发 送 消息 来 让 它们 交 成 真正 
的 服务 器 。 

举 个 例子 ,通常 的 做 法 是 启用 一 个 Web 服 务 器 ， 然 后 安装 Web 服 务 器 插件 。 我 的 做 法 是 后 
退 一 步 ， 先 安装 一 个 室 白 服务 器 ， 以 后 再 让 插件 把 它 转变 成 Web 服 务 器 。 当 我 们 不 再 需要 Web 


服务 器 时 ， 就 可 以 把 它 变 成 别 的 东西 。 





本 里 的 服务 天 示例 其 实 并 不 怎么 正确 。 它 们 的 编写 方式 是 为 了 强调 有 关 的 概念 , 然而 确实 
存在 着 一 两 个 极其 微小 的 隐 含 错误 。 我 不 会 马上 告诉 你 这 些 错 误 是 什么 , 不 过 在 本 章 的 最 后 我 会 
给 出 一 些 提 示 。 

Erlang 的 gen_server 模 块 是 不 断 强化 的 服务 器 ( 就 像 在 本 章 里 编写 的 那些 ) 逐渐 形成 的 逻 
辑 成 果 。 

它 从 1998 年 起 就 被 用 于 工业 产品 ,一 个 产品 可 以 包含 数 百 个 服务 器 , 这 些 服务 絮 正 是 程序 员 
使 用 普通 的 顺序 代码 编写 的 。 所 有 的 错误 处 理 和 非 函 数 行为 都 被 排除 在 服务 器 的 通用 部 分 之 外 。 

现在 我 们 将 蜂 越 想象 ， 来 看 看 真正 的 gen_server。 














22.2 gen server 入 门 





我 将 直接 把 你 扔 进深 水 区 。 以 下 三 点 是 编写 gen_server 回 调 模块 的 简要 步 又 。 
(1) 确定 回调 模块 名 。 
(2) 编写 接口 函数 。 





(3) 在 回调 模块 里 编写 六 个 必需 的 回调 函数 。 
这 真 的 很 简单 。 不 要 多 想 ， 只 需 按 步 又 行事 ! 





22.2.1 确定 回调 模块 名 
我 们 将 制作 一 个 简单 的 支付 系统 。 把 这 个 模块 称 为 ny bank (我 的 银行 )。 
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22.2.2 ”编写 接口 方法 


我 们 将 定义 五 个 接口 方法 ,它们 都 在 my_bank 醒 块 里 。 
DQ start() 
打开 银行 。 
DQ stop() 
关闭 银行 。 
D new account (Who) 
创建 一 个 新 账户 。 
DQ deposit (Who, Amount) 
把 钱 存 入 银行 。 
DQ withdraw(Who, Amount) 
把 钱 取 出 来 ( 如 有 果 有 结余 的 话 )。 
每 个 函数 都 正好 对 应 一 个 gen server 方 法 调用 ， 代 码 如 下 : 





my_bank.erl 


start() -> gen server:start link({local, ?SERVER}, ?MODULE, [], [|]). 
stop() -> gen server:call(?MODULE, stop). 


new_account (Who) -> gen server:call(?*MODULE, {new, Who}). 
deposit (Who, Amount) -> gen server:call(?MODULE, {add, Who, Amount}). 
withdraw(Who, Amount) -> gen server:call(?MODULE, {remove, Who, Amount}). 





gen server:start link({local，Name}，Mod，.,..) 会 启动 一 个 本 地 服务 益 。 如 果 第 一 
个 参数 是 原子 gLobaL， 它 就 会 启动 一 个 能 被 Erlang 节 点 集群 访问 的 全 局 服务 器 。start_ Link 的 
第 二 个 参数 是 Mod， 也 就 是 回调 模块 名 。 宏 ?MODULE 会 展开 成 模块 名 my_bank。 目 前 我 们 将 忽略 
gen server:start link 的 其 他 参数 。 

gen_server:call(?MODULE，Term) 被 用 来 对 服务 右 进 行 远程 过 程 调用 。 











22.2.3 ”编写 回调 方法 


我 们 的 回调 模块 必须 导出 六 个 回调 方法 : init/1、handle call/3、handle cast/2、 
handle info/2、terminate/2 和 code change/3。 
为 何 单 起 见 ， 可 以 使 用 一 些 模板 来 制作 gen_server。 下 面 是 最 简单 的 一 种 : 








gen_server_template.mini 


-module(). 

%% gen server 迷 你 模板 
-behaviour(gen server). 
-export({start Link/O]}). 
%% gen SeErVer 回 调 涵 数 
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-export([init/l, handle call/3, handle cast/2, handle info/2, 
terminate/2, code change/31). 


start link() -> gen server:start link({local, ?SERVER}, ?MODULE, [], [1). 
init([]) -> {ok, State}. 


handle call( Regquest, From, State) -> {reply, Reply, State}. 
handle cast( Msg, State) -> {noreply, State}. 

handle info( Info, State) -> {noreply, State}. 

terminate( Reason, State) -> OK， 

code change( OldVsn, State, Extra) -> {ok, State}. 


这 个 模板 包含 了 一 套 简 单 的 框架 , 可 以 填充 它们 来 制作 服务 右 。 如 果 忘 记 定 义 合 适 的 回调 销 
数 ， 编 详 需 就 会 根据 关键 字 -behaviour 来 生成 警告 或 错误 消息 。start_ Link() 旺 数 里 的 服务 需 
名 ( 安 ?SERVER ) 需要 进行 定义 ， 因 为 它 默 认 是 没有 定义 的 。 














提示 “如 果 你 正在 使 用 Emacs， 那 么 敲 几 下 按键 就 能 调 入 一 个 gen server 模 板 。 如 果 你 在 
erlang-mode ( Erlang 模 式 ) 下 编辑 ， 则 可 以 通过 Erlang > SkeLetons 菜 单 生 成 的 标签 页 来 
创建 一 个 gen Server 模 板 。 如 果 没 有 Emacs， 无 需 惊 慌 。 我 会 在 本 章 最 后 把 模板 放 上 来 。 


我 们 将 从 模板 入手， 对 它 稍 作 修改 。 要 做 的 就 是 让 接口 方法 里 的 参数 与 模板 里 的 参数 保持 一 致 。 
handle_call/3 卫 数 最 为 重要 。 我 们 必须 编写 代码 , 让 它 匹 配 接口 方法 里 定义 的 三 种 查询 数 
据 类 型 。 也 就 是 资 ， 必 须 填 写 以 下 代码 里 的 这 些 点 : 


handle call({new, Who}, From, State} -> 
Reply = ..,. 
Statel = ... 
{reply, Reply, Statel}; 
handle call({add, Who, Amount}, From, State} -> 
Reply = ... 
Statel 
{reply, Reply, Statel}; 
handle call({remove, Who, Amount}, From, State} -> 
Reply = .,.., 
Statel = ... 
{reply, Reply, Statel}; 


这 段 代 人 码 里 的 Reply 值 会 作为 远程 过 程 调 用 的 返回 值 发 回 客 尸 问 。 

State 只 是 一 个 代表 服务 胡 全 局 状态 的 变量 ， 它 会 在 服务 带 里 到 处 传递 。 在 我 们 的 银行 模块 
里 ， 这 个 状态 永远 不 会 发 生变 化 ， 它 只 是 一 个 ETS 表 的 索引 ， 属 于 常量 (虽然 表 的 内 容 会 变化 )。 

填写 模板 并 稍 加 改动 之 后 ， 就 形成 了 以 下 代码 : 




















my_bank.erl 
jnit([]) -> {ok, ets:new(?MODULE,[])}. 


handle call({new,Who}, From, Tab) -> 
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Reply = case ets:Lookup(Tab，Who) of 
[] -> ets:insert(Tab, {Who,O0}), 
{welcome, Whot:; 
[_] -> {Who, you already are a customer} 
end, 
{reply, Reply, Tab}; 


handle call({add,WwWho,X}, From, Tab) -> 
Reply = case ets:lookup(Tab, Who) of 
[] -> not a customer; 
[{Who,Balance}] -> 
NewBalance = Balance + X, 
ets:insert(Tab, {Who, NewBalance}), 


{thanks, Who, your balance is, NewBalancel} 
end, 


{reply, Reply, Tab}; 


handle call({remove,Who, X}, From, Tab) -> 
Reply = Case ets:lookup(Tab, Who) of 
[] -> not a customer.,; 
[{Who,Balance}] when X =< Balance -> 
NewBalance = Balance - X, 
ets:insert(Tab, {Who, NewBalance}), 
{thanks, Who, your balance is, NewBalance}.; 
[{Who,Balance}] -> 
{sorry,Who,you only have,Balance,in the bank} 
end, 
{reply, Reply, Tab}; 





handle call(stop, From, Tab) -> 

{stop, normal, stopped, Tab}. 
handle cast( Msg, State) -> {noreply, State}. 
handle info( Info, State) -> {noreply, State}. 
terminate( Reason, State) -> ok. 
code change( OldVsn, State, Extra) -> {ok, State}. 


调用 gen server:start Link(Name，CaLLBackMod，StartArgs，0pts) 来 启动 服务 需 ， 
之 后 第 一 个 被 调用 的 回调 模块 方法 是 Mod:init(StartArgs)， 它 必须 返回 {ok,，, State}。State 
的 值 作为 handle_call 的 第 三 个 参数 重新 出 现 。 

请 注意 我 们 是 如 何 停 止 服务 器 的 。handle caLL(stop，From，Tab) 返 回 {stop，normalt， 
stopped，Tab}， 它 会 停止 服务 需 。 第 二 个 参数 (normat ) 被 用 作 my _bank:terminate/2 的 首 
个 参数 。 第 三 个 参数 ( stopped ) 会 成 为 ny_bank:stop() 的 返回 值 。 

就 是 这 样 ， 我 们 的 任务 完成 了 。 下 面 来 访问 一 下 银行 。 

1> my_bank:start(). 

{ok, <0.33.0>} 


2> my_bank:deposit("]joe", 10). 
not a customer 
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3> my_bank:new account ("joe'" ) . 
{welcome,"joe"} 

4> my_bank:deposit("]joe", 10). 
{thanks,"joe",your baLance is,10} 

5> my_bank:deposit("joe", 30). 
{thanks,"joe",your balance 1s,40} 

6> my _ bank:withdraw("joe"”", 15). 
{thanks,"joe",your balance is,25} 

7> my_bank:withdraw("joe", 45). 
{sorry,"joe",youyu only have,25,in the bank} 


22.3 ”gen server 的 回调 结构 
理解 了 相关 概念 之 后 ， 我 们 来 详细 了 解 一 下 gen_server 的 回调 结构 。 


22.3.1 


局 动 服务 器 


gen server:start Link(Name，Mod，InitArgs，0pts) 这 个 调用 是 所 有 事物 的 起 点 。 它 
会 创建 一 个 名 为 Name 的 通用 服务 硕 ， 回 调 模块 是 Mod，0pts 则 控制 通用 服务 需 的 行为 。 在 这 里 可 











以 指定 消息 记录 、 困 数 调 试 和 其 他 行为 。 通 用 服务 需 通 过 调用 Mod :init(InitArgs) 启 动 。 
图 22-1 展 示 了 init 的 模板 项 ( 完整 的 模板 可 以 在 A.1 市 找到 )。 


%% @private 
%% Gdoc 


%% 初始 化 服务 右 


%% @spec init(Args) -> {ok, State} | 


%% {ok, State, Timeout} | 
%% ignore | 
%% {stop, Reason} 


init([]) -> 
{ok, #state{}}. 


图 22-1 ”init 的 模板 项 





在 通常 的 操作 里 ， 只 会 返回 {ok，State}。 要 了 解 其 他 参数 的 含义 ， 请 参考 gen server 的 手 


册页 。 


如 果 返 回 {ok，State}y， 就 说 明 我 们 成 功 启 动 了 服务 器 ， 它 的 初始 状态 是 State。 


22.3.2 


调用 服务 器 





要 调用 服务 侣 ， 客 户 问 程序 需要 执行 gen server:call(Name，Request)。 它 最 终 调 用 的 
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是 回调 模块 里 的 handle cal1l/3。 
handle_cal1l/3 的 模板 项 如 下 : 


%% @private 
%% 00C 
%% 处 理 调用 消息 


%% @spec handle call(Request, From, State) -> 


%% treply, Reply, State} | 

%% treply, Reply, State, Timeout} | 
%% tnoreply, State} | 

%% tnoreply, State, Timeout} | 

%% tstop, Reason, Reply, State} | 
2% {stop, Reason, State} 


handle call( Request, From, State) -> 


Reply = ok, 
{reply, Reply, State}. 
Request( gen server:call/2 的 第 二 个 参数 ) 作 为 handle _cal1/3 的 第 一 个 参数 重新 出 现 。 








From 是 发 送 请 求 的 客户 端 进程 的 PID， eu 前 的 当前 状态 。 
我 们 通 稼 会 返回 {repLy，RepLy，NewState}。 在 这 种 情况 下 ，ReptLy 会 返回 客户 端 ， 成 为 
gen server:call 的 返回 值 。NewState 则 是 服务 器 接 下 来 的 状态 。 
其 他 的 返回 值 ( {noreply，..} 和 {stop，..} ) 相对 不 太 常 用 。no reply 会 让 服务 器 继续 
工作 , 但 客户 端 会 等 待 一 个 回复 ,所 以 服务 器 必须 把 回复 的 任务 委派 给 其 他 进程 。 用 适当 的 参数 
调用 stop 会 停止 服务 天 


22.3.3 ”调用 和 播发 


我 们 已 经 见 过 了 gen_server:call 和 handle_call 之 则 的 交互 ， 它 的 作用 是 实现 远程 过 程 
调用 。gen_server:cast(Name, Msg) 则 实现 了 一 个 播发 (cast )， 也 就 是 没有 返回 值 的 调用 〈 实 
际 上 束 是 一 个 消息 ， 但 习惯 上 称 它 为 播发 来 与 远程 过 程 调用 相 区 分 )。 

对 应 的 回调 方法 是 handle_cast， 它 的 模板 项 如 下 : 








%% G@prIvate 

%% Gooc 

%% 处 理 播 发 消息 

%% @spec handle cast(Msg, State) -> {noreply, State} | 

%% {noreply, State, Timeout} | 


2% {stop, Reason, State} 


2 
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handle cast( Msg, State) -> 
{noreply, State}. 
这 个 处 理 也 数 通常 只 返回 {noreply，NewState} 或 {stop，.. .}。 前 者 改变 服务 器 的 状态 ， 
后 者 停止 服务 器 。 


22.3.4 发 给 服务 器 的 自发 性 消息 


回调 函数 handte_info(Info, State) 被 用 来 处 理发 给 服务 帮 的 目 发 性 消 且 。 目 发 性 消 且 是 
一 切 未 经 显 式 调用 gen_server:calLL 或 gen_server:cast 而 到 达 服 务 硕 的 消息 。 举 个 例 和 于， 如 
条 服务 硕 连 接 到 另 一 个 进程 并 捕捉 退出 信号 ， 丈 可 能 会 突然 收 到 一 个 预料 之 外 的 {EXIT'，Pid， 
What} 消 息 。 除 此 之 外 ， 系 统 里 任何 知道 通用 服务 硕 PID 的 进程 都 可 以 回 它 发 送 消息 。 这 样 的 消 
县 在 服务 硕 里 表现 为 info 值 。 

handle info 的 模板 项 如 下 : 





%% @private 
%% Gooc 
%% 处 理 所 有 非 调用 /播发 的 消息 


%% @spec handle info(Info, State) -> {noreply, State} | 
2% tnoreply, State, Timeout} | 
2% {stop, Reason, State} 


handle info( lnfo, State) -> 
{noreply, State}. 


它 的 返回 值 和 handtle cast 相 同 。 


22.3.5 ”后 会 有 期 ， 宝 贝 


服务 器 会 因为 许多 原因 而 终止 。 某 个 以 handle 开头 的 函数 也 许 会 返回 一 个 {stop，Reason， 
NewState}， 服 务 器 也 可 能 崩 当 并 生成 {'EXIT'，reason}。 在 所 有 这 些 情况 下 ， 无 论 它们 是 怎 
样 发 生 的， 都 会 调用 terminate(Reason，NewState)。 它 的 模板 项 如 下 。 


%% @private 

%% 00C 

%% 这 个 函数 是 在 某 个 gen _Sserver 即 将 终止 时 调用 的 。 

%% 它 应 当 是 Module:init/1 的 送 操 作 ， 并 进行 必要 的 清理 ， 

%% 当 它 返回 时 ，<mod>gen Server</mod> 终 止 并 生成 原因 Reason。 
%% 它 的 返回 值 会 被 忽略 。 


%% @spec terminate(Reason, State) -> void!{() 
%% @end 
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人 -总 
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terminate( Reason, State) -> 
ok. 


这 段 代 码 不 能 返回 一 个 新 状态 ， 因 为 我 们 已 经 终止 了 。 但 是 了 解 服务 器 在 终止 时 的 状态 非 
第 有 用 。 可 以 把 状态 保存 到 磁盘 ， 把 它 放 入 消息 发 送 给 别 的 进程 ， 或 者 根据 应 用 程序 的 意愿 丢 
弃 它 。 如果 想 让 服务 妖 过 后 重启 , 就 必须 编写 一 个 “我 胡 汉 三 叉 回 来 了 ”的 函数 ,由 terminate/2 
触发 。 


22.3.6 ”代码 更 改 


你 可 以 在 服务 带 运 行 时 动态 更 改 它 的 状态 。 这 个 回调 函数 会 在 系统 执行 软件 升级 时 由 版 本 人 处 
理子 系统 调用 。 
OTP 系 统 文档 "里 的 版 本 处 理 一 节 详 细 介 绍 了 这 个 主题 。 























%% @private 
%% (doc 
%% 在 代码 更 改 时 转换 进程 状态 


%% G@Spec code change(0OldVsn, State, Extra) -> {ok, NewSstate} 
@ 


code change( OldVsn, State, Extra) -> 
{ok, State}. 





22.4 填写 gen server 模板 


编号 OTPgen _server 大 任 上 就 是 用 你 的 代码 填充 一 个 预制 模板 ， 下 面 是 一 个 例子 。 前 一 市 
分 别 列 出 了 gen server 的 各 个 区 块 。 Emacs 内 建 了 gen server 模 板 , 但 如 果 你 不 使 用 Emacs, 也 
可 以 在 A.1 市 找到 完整 的 模板 。 

我 通过 填充 模板 生成 了 一 个 名 为 my_bank 的 银行 模块 。 这 段 代 码 取 目 模 板 。 我 移 除 了 模板 里 
的 所 有 注释 ， 这 样 就 能 清楚 地 看 到 代码 的 结构 。 





my_bank.erl 


-module (my bank). 


-behaviour (gen server). 

-export([start/0]1). 

%% gen SeErver 回 调 涵 数 

-export([init/1, handle call/3, handle cast/2, handle info/2, 
terminate/2, code change/3]). 


GD http://www.erlang.org/doc/pdf/otp-system-documentation.pdf 
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-compile(export all). 
-define (SERVER, ?MODULE). 


start() -> gen server:start link({local, ?SERVER}, ?MODULE, [1], [1]1). 
stop() -> gen server:call(?MODULE, stop). 


new_account (Who) -> gen server:call(?MODULE, {new, Who}). 
deposit(Who, Amount) -> gen server:call(?MODULE, {add, Who, Amount}). 
withdraw(Who, Amount) -> gen server:call(?MODULE, {remove, Who, Amount})., 


jnit([]) -> {ok, ets:new(?MODULE,{[])}. 


handle call({new,Who}, From, Tab) -> 
Reply = case ets:lookup(Tab, Who) of 
[] -> ets:ijnsert(Tab, {Who,0}), 
{welcome, Who}; 
[ ] -> {Who, you already are a customer} 
end, 
{reply, Reply, Tab}; 


handle call({add,Who,X}, From, Tab) -> 
Reply = case ets:lookup(Tab, Who) of 
[] -> not a customer; 
[{Who,Balance}] -> 
NewBalance = Balance + X, 
ets:insert(Tab, {Who, NewBalance}), 
{thanks, Who, your balance is, NewBalance} 
end, 
{reply, Reply, Tab}; 


handle call({remove,Who, xX}, From, Tab) -> 
Reply = case ets:lookup(Tab, Who) of 
[] -> not a customer; 
[{Who,Balance}] when X =< Balance -> 
NewBalance = Balance - X, 
ets:insert(Tab, {Who, NewBalance}), 
{thanks, Who, your balance is, NewBalance}; 
[{Who,Balance}] -> 
{sorry,Who,youyu only have,Balance,in the bank} 
end, 
{reply, Reply, Tab}; 


handle call(stop, From, Tab) -> 

{stop, normal, stopped, Tab}. 
handle cast( Msg, State) -> {noreply, State}. 
handle info( Tnfo, State) -> {noreply, State}. 
terminate( Reason, State) -> ok. 
code change( OldVsn, State, Extra) -> {ok, State}. 
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22.5 ”深入 探索 


gen server 其 实 相 当 简 单 。 我 们 并 未 全 面 介绍 gen server 里 的 接口 函数 , 也 没有 解释 
这 些 子 数 的 全 部 变量 。 一 旦 理解 了 基本 的 概念 ， 就 可 以 去 gen server 的 手册 页 里 查找 更 多 
细 广 。 

这 一 间 只 介绍 了 最 简单 的 gen_server 使 用 方式 ,但 它 应 该 足以 应 付 大 多 数 需 求 了 。 复 杂 程 
度 更 高 的 应 用 程序 经 常会 让 gen server 回 复 一 个 noreply 返 回 值 ， 并 把 真正 的 回复 任务 委派 给 
男 一 个 进程 。 要 了 解 更 多 这 方面 的 信息 ， 请 阅读 “Design Principlegs” ”2 (设计 原则 ) 文档 ， 以 及 
sys 和 proc Lib 模块 的 手册 页 。 

本 和 草 介 绍 了 把 服务 需 行 为 抽象 成 两 个 部 分 这 一 概念 : 通用 部 分 可 以 用 于 所 有 服务 磊 , 特有 部 
分 ( 处理 模块 ) 可 以 用 来 对 通用 部 分 进行 定制 。 这 么 做 的 主要 优点 是 代码 能 整齐 地 一 分 为 二 。 通 
用 部 分 解决 众多 并 发 和 错误 处 理 问题 ， 而 处 理 模 块 只 包含 顺序 代码 。 

在 此 之 后 ， 我 们 介绍 了 OTP 系 统 里 的 第 一 种 主要 行为 : gen server， 并 展示 了 如 何 从 一 个 
相当 简单 旦 容易 理解 的 服务 厦 入 手 ， 通 过 逐步 的 转变 来 实现 它 。 

gen_server 的 用 途 很 广 ， 但 它 并 不 能 包 治 百 病 。gen_server 的 客户 端 -服务 套 交 互 模式 有 
时 候 会 让 人 感觉 别扭, 与 你 的 问题 不 能 良好 兼容 。 如 果 是 这 样 , 就 需要 重新 思考 制作 gen_server 
所 需要 的 转变 步 又 ， 根 据 问题 的 特殊 需要 来 修改 它们 。 

当 我 们 从 单个 服务 需 转 癌 系 统 时 ,就 会 用 到 很 多 服务 需 。 我 们 和 希望 能 以 一 致 的 方式 监视 它们 、 
重启 退出 的 服务 套 以 及 记录 错误 。 这 就 是 下 一 曹 的 主题 。 



































22.6 ”练习 


在 下 面 这 些 练习 里 ,我们 将 用 job_cent re 模块 制作 一 个 服务 天 , 它 用 gen_server 实 现 一 种 
任务 管理 服务 。 任 务 中 心 (job center ) 持 有 一 个 必须 完成 的 任务 队列 ， 这 些 任务 会 被 编号 ， 任 何 
人 都 能 癌 队 列 添加 任务 。 工 人 可 以 从 队列 请 求 任 务 ,， 并 告诉 任务 中 心 已 经 执行 了 某 项 任务 。 任 务 
是 由 fun 表 示 的 ， 要 执行 任务 F， 工 人 必须 执行 F( ) 哨 数 。 

(1) 实现 任务 中 心 的 基本 功能 ， 它 的 接口 如 下 。 

DQ Job centre:start link() -> true 

局 动 任务 中 心服 务 右 。 
DQ Job centre:add job(F) -> JobNumber 
添加 任务 F 到 任务 队列 ， 然 后 返回 一 个 整数 任务 编号 。 
DQ job centre:work wanted() -> {JobNumber,F} | no 
请 求 任务 。 如 果 工 人 想 要 一 个 任务 ， 就 调用 job centre:work wanted()。 如 果 队 列 里 
有 任务 ， 就 会 返回 一 个 {JobNumber，F} 元 组 。 工 人 执行 F( ) 来 完成 任务 。 如 果 队 列 里 没 
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有 任务 ， 则 会 返回 no。 请 确保 同一 项 任务 每 次 只 分 配给 一 个 工人 ， 并 确保 系统 是 公平 的 ， 
意思 是 任务 按照 请 求 的 顺序 进行 分 配 。 

DQ job centre:job done(JobNumber) 

发 出 任务 完成 的 信号 。 如 末 工 人 完成 了 某 一 项 任务 ， 就 必须 调用 job_centre:job_done 
(JobNumber ) 。 

(2) 添加 一 个 名 为 job_centre:statistics() 的 统计 函数 ,让 它 报告 队列 内 、 进 行 中 和 已 完 
成 任务 的 状态 。 

(3) 添加 监视 工人 进程 的 代码 。 如 果 某 个 工人 进程 挂 了 ， 请 确保 它 所 执行 的 任务 被 返回 到 等 
竺 完成 的 任务 池 里 。 

(4) 检查 是 否 有 懒惰 的 工人 ， 也 就 是 接受 工作 但 不 按时 完成 的 进程 。 把 任务 请 求 函数 修改 为 
返回 {JobNumber, JobTime, F}, 其 中 JobTime 是 工人 必须 完成 任务 的 秒 数 。 如 果 工 人 在 JobTime 
- 1 时 还 未 完成 任务 ， 服 务 器 就 应 当 癌 其 发 送 一 个 hurry_up〔 快 点 儿 ) 消息 ， 而 在 JobTime + 1 
时 应 该 用 调用 exit (Pid，youre fired) (你 被 解雇 了 ) 来 杀 挥 这 个 工人 进程 。 

(5) 可 选 练习 : 实现 一 个 工会 服务 需 来 监督 工人 的 权利 ， 防 止 他 们 没收 到 警告 就 被 解雇 。 提 
示 : 使 用 进程 跟踪 基本 需 数 来 实现 它 。 




















用 OTP 构 建 系统 


这 一 草 将 构建 一 个 系统 ,把 它 作 为 一 家 网 络 公 司 的 后 并 。 我 们 这 家 公司 销售 两 种 商品 : 质数 
和 面积 。 顾客 可 以 从 这 里 购买 质数 ,也 可 以 请 我 们 计算 某 个 几何 对 象 的 面积 。 我 认为 公司 发 展 洪 
力 巨 大 。 

将 制作 两 个 服务 圳 : 一 个 生成 质数 ， 另 一 个 计算 面积 。 并 使 用 22.2 节 里 讨论 的 gen_server 
框架 来 实现 它们 。 

在 构建 系统 时 必须 考虑 到 错误 。 即 使 彻底 测试 了 软件 ， 也 不 一 定 能 捕获 所 有 的 bug。 假 设 其 
中 一 个 服务 器 带 有 会 导致 服务 大 月 演 的 致命 错误 。 确切 地 说 , 故意 引入 一 个 错误 来 使 其 中 一 个 服 
务 融 朋 溃 。 

当 服 务 右 月 演 时 ， 需 要 一 种 机 制 来 检测 这 种 情况 并 重启 它 ， 为 此 将 用 到 监控 树 ( supervision 
tree ) 这 个 概念 。 创 建 一 个 监控 器 来 管理 服务 器 ， 如 果 服 务 器 朋 演 就 重启 它们 。 

当然 , 如 果 服 务 右 确实 骨 演 了 , 我 们 希望 知道 它 崩 演 的 原因 , 这 样 就 能 在 未 来 修复 这 个 问题 。 
为 了 记录 所 有 错误 ， 可 以 使 用 OTP 的 错误 记录 需 。 我 们 会 展示 如 何 配置 错误 记录 需 ， 以 及 如 何 根 
据 错误 日 志 生 成 错误 报告 。 

计算 质数 ( 特别 是 大 质数 ) 时 ，CPU 可 能 会 过 热 ， 这 就 需要 开局 一 个 强力 风 届 来 避免 这 种 情 
况 。 要 做 到 这 一 点 ， 需 要 考虑 警报 。 我 们 会 用 OTP 事 件 处 理 框架 来 生成 和 处 理 警 报 。 

所 有 这 些 主题 ( 创建 服务 器 、 监 探 服务器 、 记 录 错 误 和 检测 警报 ) 是 一 切 生 产 系 统 都 必须 解 
决 的 典型 问题 。 因 此 ,虽然 公司 前 途 未 卜 ， 却 可 以 在 许多 系统 里 重复 使 用 这 种 架构 。 事 实 上 , 许 
多 在 商业 上 获得 成 功 的 公司 都 在 使 用 这 种 架构 。 

最 后 ， 当 一 切 都 能 正常 工作 时 ， 所 有 代码 都 会 被 打包 到 一 个 OTP 应 用 程序 里 。 这 是 一 种 把 于 
绕 某 个 问题 的 事物 组 合 到 一 起 的 专用 方法 ， 让 OTP 系 统 上 自身 来 启动 、 停 止 和 管理 它 。 

要 决定 按 什么 顺序 呈现 这 些 材 料 并 不 容易 ,因为 许多 领域 之 间 存 在 循环 依赖 关系 。 错误 记录 
只 是 事件 管理 的 一 个 特例 。 警 报 就 是 一 种 消息 ,错误 记录 器 是 一 个 被 监控 进程 ,但 是 进程 监控 需 
可 以 调用 错误 记录 需 。 

我 将 尝试 理 出 某 种 顺序 ， 把 这 些 主题 相对 有 条 理 地 呈现 出 来 。 我 们 将 做 下 面 这 些 事 。 

(1) 熟悉 通用 事件 处 理 器 里 用 到 的 概念 。 

(2) 了 解 错 误 记 录 需 的 工作 方式 。 

(3) 添加 警报 管理 功能 。 
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(4) 编写 两 个 应 用 程序 服务 从。 
(5) 制作 一 个 监控 树 ， 并 给 它 涂 加 服务 全 。 
(6) 把 这 一 切 打 包 成 一 个 应 用 程序 。 


23.1 通用 事件 处 理 


事件 就 是 已 发 生 的 事情 : 它 是 值得 注意 的 ， 程 序 员 认 为 有 人 应 该 对 它 做 些 什 么 。 

如 采 在 编程 的 时 候 发 生 了 一 件 值 得 注意 的 事 ， 束 会 发 送 一 个 event 消 息 给 某 个 注册 进程 ,就 
像 这 样 : 

RegProcName ! {event, E} 


E 是 事件 ( 可 以 是 任意 Erlang 数 据 类 型 )，RegProcName 是 注册 进程 名 。 

发 送 消 息 后 我 们 不 知道 (也 不 关心 ) 它 的 命运 。 只 是 完成 目 己 的 任务 ,告诉 其 他 人 有 什么 事 
发 生 。 

现在 把 注意 力 转 癌 接 收 事件 消息 的 进程 , 它 被 称 为 事件 处 理 器 。 最 简单 的 事件 处 理 需 就 是 一 
个 “什么 都 不 做 ”的 处 理 器 。 当 它 收 到 一 个 {event，X} 消 息 时 不 会 对 它 做 任何 处 理 ， 只 会 把 它 
丢弃 。 


下 面 是 我 们 对 通用 事件 处 理 程 序 的 首次 笠 试 。 






































event handler.erl 


-module(event handler). 
-export([make/l1, add handler/2, event/2]). 
%% 制作 一 个 名 为 Name 的 新 事件 处 理 器 
%% 处 理 函 数 是 nO0_0p， 代 表 不 对 事件 做 任何 处 理 
make (Name) -> 
register (Name, spawn(fun() -> my handler (fun no op/1) end)). 
add handler(Name, Fun) -> Name ! {add, Fun}. 


%% 生成 一 个 事件 
event (Name, x) -> Name ! {event, Xt}. 


my_handler(Fun) -> 
receive 
{add, Funl} -> 
my_handler (Fun1), 
{event, Any} -> 
(catch Fun(Any)), 
my_handler (Fun) 
end. 
no _op( ) -> void. 


这 个 事件 处 理 融 的 API 如 下 。 
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DQ event handler:make(Name) 
制作 一 个 “什么 都 不 干 ” 的 事件 处 理 器 Name (一 个 原子 )。 这 样 消息 就 有 地 方 发 送 了 。 
Devent handler:event (Name，X) 
发 送 消息 X 到 名 为 Name 的 事件 处 理 器 。 
DQ event handler:add handler(Name, Fun) 
给 名 为 Name 的 事件 处 理 副 添加 一 个 处 理 孔 数 Fun。 这 样 当 事件 x 发 生 时 ， 事 件 处 理 帮 就 会 
执行 Fun (X)。 
现在 创建 一 个 事件 处 理 器 并 生成 一 个 错误 。 


1> event handler:make(errors). 





true 

2> event handler:event(errors, hi). 

{event, hi} 

没什么 特别 的 事 发 生 ， 因 为 我 们 还 没有 给 事件 处 理 硕 安 猴 回调 模块 。 

要 让 事件 处 理 器 能 做 点 什么 , 必须 编写 一 个 回调 模块 并 把 它 安 闭 到 事件 处 理 顺 里 。 这 是 一 个 


事件 处 理 硕 回调 模块 的 代码 : 


motor _ controller.erl 


-moduLe(motor_controLLer) . 
-export([add event handler/0]). 


add event handler() -> 

event handler:add handler(errors, fun controller/1). 
controller(too hot) -> 

lio:format("Turn off the motor~n"); 
controller(X) -> 

lo:format("~w ignored event: ~p~n",[?MODULE, X]). 


编译 之 后 就 可 以 安 闻 它 了 。 


3> Cc(motor controller). 

{ok,motor controller} 

4> motor controller:add event handler(). 
{add,#Fun<motor controller.0.99476749>} 


现在 当 我 们 发 送 消息 给 处 理 器 时 ， 隐 数 motor controller:controller/1 会 处 理 这 些 消 





JU O 


5> event handler:event(errors, cool). 
motor controller ignored event: cool 
{event, cool} 

6> event handler:event(errors, too hot). 
Turn off the motor 

{event, too hot} 


个 练习 有 两 个 目的 。 育 移 ， 提 供 一 个 名称 来 作为 消息 发 送 的 目的 地 ， 也 就 是 名 为 errors 
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的 注册 进程 。 然后 定义 一 个 协议 来 发 送 事 件 给 这 个 注册 进程 , 但 并 没有 说 明 消 奶 到 达 后 会 发 生 什 
么 。 事 实 上 ， 唯 一 发 生 的 事 就 是 执行 了 no_0p(X) 。 随 后 安装 一 个 自 定 义 的 事件 处 理 器 ， 这 人 么 做 
本 质 上 是 把 事件 生成 和 事件 处 理 分 开 进 行 , 这 样 我 们 就 能 暂 不 决定 如 何 处 理事 件 , 同时 又 不 影响 
事件 生成 。 

这 里 的 要 点 在 于 事件 处 理 带 提供 了 一 种 染 构 ， 让 我 们 可 以 安 疲 日 定义 的 处 理 檀 。 

错误 记录 带 的 淋 构 避 循 事件 处 理 哥 的 模式 。 可 以 在 错误 记录 从 里 安 寂 不 同 的 处 理 带 来 让 它 做 
不 同 的 事情 。 老 报 处 理 染 构 同 样 体 循 这 一 模式 。 


23.2 ” 销 误 记录 天 
OTP 系 统 自 带 一 个 可 定制 的 错误 记录 器 。 可 以 从 三 个 角度 看 待 错误 记录 器 : 程序 员 视角 关心 


程序 员 为 了 记录 错误 而 在 代码 里 中 做 的 函数 调用 ; 配置 视角 关心 错误 记录 带 在 何人 处 以 及 如 何 保 存 
数据 ; 报告 视角 关心 对 已 发 生 错误 的 分 析 。 稍 后 会 对 这 三 个 角度 逐一 进行 讨论 。 

















“可 以 改 主 意 ” 的 超 后 期 绑 定 
假设 我 们 在 编写 一 个 对 程序 员 隐 藏 event handler:event 方 法 的 函数 ,例如 下 面 这 个 : 


lib_misc.erl 
too hot() -> 


event handler:event(errors, too hot). 

然后 告诉 程序 员 在 出 问题 时 要 调用 代码 里 的 Lib misc:too hot()。 在 大 多 数 编程 语言 
里 ， 对 函数 too_hot 的 调用 会 被 静态 或 动态 链接 到 调用 该 函数 的 代码 上 。 一 旦 链接 完成 ， 它 就 
会 根据 代码 要 求 执行 国定 任务 。 如 果 我 们 后 来 改变 主意 要 做 其 他 的 事 , 就 没有 什么 简单 的 办 法 
能 改变 系统 行为 了 。 

Erlang 处 理事 件 的 方法 则 完全 不 一 样 。 它 允许 我 们 把 事件 生成 和 事件 处 理 分 开 进 行 。 任 何 
时 候 都 可 以 修改 处 理 方法 ,只 需 向 事件 处 理 器 发 送 一 个 新 的 处 理 函 数 即 可 。 不 存在 什么 静态 链 
接 ， 只 要 你 愿意 ， 事 件 处 理 函数 可 以 随时 更 换 。 

通过 这 种 机 制 ， 可 以 构建 与 时 俱 进 的 系统 ， 永 远 不 需要 停止 它们 来 升级 代码 。 

注意 : 这 不 是 “后 期 绑 定 ”， 而 是 “ 超 后 期 绑 定 ， 以 后 还 可 以 改 主意 ”。 


23.2.1 记录 错误 
对 程序 员 来 说 ， 这 个 错误 记录 需 的 API 很 简单 。 以 下 是 一 个 简单 的 API 子 集 : 


@ -spec error logger:error Msg(String) -> ok 


癌 错 误 记 录 带 发 送 一 个 错误 祖居 。 
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1> error logger:error msg("An error has occurred\n"). 


=ERROR REPORT==== 15-Jul-2013::17:03:14 === 
An error has occurred 
ok 


@ -spec error logger.error msg(Format, Data) -> ok 
问 错 误 记 录 带 发 送 一 个 错误 消息 。 它 的 参数 和 io:format (Format，Data) 相 同 。 


2> error logger:error msg("~s, an error has occurred\n", ["Joe"]). 


=ERROR REPORT==== 15-Jyul-20]13::17:04:03 === 
Joe, an error has occurred 
ok 


@ -spec error logger:error report(Report) -> ok 
问 销 误 记录 病 发 送 一 个 标准 销 误 报告 
DQ -type Report = [{Tag, Data} | term() | string() |]. 
D -type Tag = term(). 
D -type Data = term(). 
3> error logger:error report([{tagl,datal},a term,{tag2,data}]). 
=ERROR REPORT==== 15-JUL-2013::17:04:41 === 
tag1: datal 


a_term 
tag2: data 


这 只 是 全 部 可 用 API 的 一 个 子 集 。 详细 讨论 它们 音义 不 大 , 我 们 的 程序 只 会 用 到 error _msg。 
完整 的 细节 可 以 在 error Logger 的 手册 页 里 找到 。 





23.2.2 ”配置 针 误 记录 颖 


有 多 种 方式 可 用 来 配置 错误 记录 需 。 可 以 让 Erlang shell 显 示 所 有 错误 ( 如 果 没 有 特别 设置 的 
话 就 是 默认 值 )， 也 可 以 把 shell 里 报告 的 所 有 错误 写 和 人 一 个 格式 化 文本 文件 。 最 后 ， 还 可 以 创建 
一 个 滚动 日 志 ( rotating log )。 可 以 把 滚动 日 志 看 作 是 一 个 大 型 循环 缓冲 区 ,内 含 错 误 记 录 融 生成 
的 消息 。 新 消息 进来 后 会 被 附加 到 日 志 的 末尾 ， 如 采 日 志 满 了 ， 最 早 的 条 目 就 会 被 删除 。 
滚动 日 志 极 其 有 用 。 你 决定 日 志 应 当 占 据 多 少 个 文件 ,以 及 每 个 日 志文 件 能 有 多 大 ,然后 系 
OA 
几 天 的 操作 记录 ， 这 通常 足以 应 付 大 多 数 用 途 了 。 
ee 
在 启动 Erlang 时 可 以 给 系统 提供 一 个 启动 参数 。 
Ds$ erl -boot start clean 
它 会 创建 一 个 适合 进行 程序 开发 的 环境 ， 只 提供 一 种 简单 的 错误 记录 形式 。( 不 带 启 动 参 
数 的 erL 命 令 就 等 于 erL -boot start clean。) 
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DD$ erl -boot start sasl 
它 会 创建 一 个 适合 运行 生产 系统 的 环境 。 系 统 架 构 文 持 库 ( System Architecture Support 
Libraries， 人 简称 SASL ) 将 负责 错误 记录 和 过 载 保 护 等 工作 。 
日 志文 件 的 配置 最 好 通过 配置 文件 实现 , 因为 没 人 能 记 住 记录 器 的 全 部 参数 。 在 接 下 来 的 几 
节 里 ， 我 们 将 来 看 看 默认 系统 的 工作 方式 ， 以 及 改变 错误 记录 器 工作 方式 的 四 种 特定 配置 。 
2. 无 包 置 SASL 
当 我 们 不 带 配 置 文件 启动 SASL 时 会 发 生 下 面 这 些 事 : 


$ erL -boot start sasl 
Erlang R16B (erts-5.10.1) [source] [smp:2:2] ... 





=PROGRESS REPORT==== 26-May-2013::12:48:37 === 
supervisor: {local,sasl safe sup} 
started: [{pid,<0.35.0>}, 
{name,alarm handtler}, 
{mfargs, {alarm handler,start Link,[]}}, 
{restart type,permanent}, 
{shutdown, 2000}, 
{child type,worker}] 
, many lines removed ... 
Eshell V5.10.] (abort with ^G) 


现在 调用 error Logger 里 的 某 个 方法 来 报告 一 个 错误 。 


1> error logger:error msg("This 15 an error\n"). 
=ERROR REPORT==== 26-May-2013::;12:;54:03 === 
This is an error 

ok 


请 注意 ， 错 误 是 在 Erlang shell 里 报告 的 。 错 误 的 报告 位 置 由 错误 记录 天 配置 决定 。 
3. 控制 记录 内 容 
错误 记录 需 会 生成 多 种 报告 类 型 。 
口 监控 器 报告 
这 些 报告 会 在 OTP 监 控 器 启动 或 停止 被 监控 进程 时 生成 (参见 23.5 市 )。 
口 进度 报告 
这 些 报告 会 在 OTP 监 控 絮 启动 或 停止 时 生成 。 
口 衣 江 报告 
如 果 某 个 被 OTP 行 为 启动 的 进程 因为 normal 或 shutdown 以 外 的 原因 终止 ， 这 些 报 告 就 会 
生成 。 
这 三 种 报告 会 自动 生成 ， 程 序 员 无 须 做 任何 事 。 
男 外 ， 还 可 以 显 式 调用 error Logger 模 块 里 的 方法 来 生成 三 种 类 型 的 日 志 报 告 。 这 让 我 们 
能 够 记录 错误 、 和 警告 和 信息 消息 。 这 三 个 名 词 没 什么 语义 含义 ， 只 是 一 些 标签 ,程序 员 用 它们 来 
提示 错误 日 志 条 目的 性 质 。 
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后 面 分 析 错 误 日 志 时 , 可 以 用 这 些 标签 来 帮助 我 们 决定 该 调查 哪些 日 志 条 目 。 在 配置 错误 记 
录 人 句 时 可 以 选择 只 保存 错误 ， 丢 弃 其 他 所 有 类 型 的 条 目 。 现 在 ， 编 瑟 配 置 文件 elog1.config 来 
配置 错误 记录 需 。 


elog1.config 
%% 无 tty 
[{sasl, [ 
{sasl error logger, false} 


1}]. 


如 果 用 这 个 配置 文件 启动 系统 ,就 只 会 得 到 错误 报告 , 不 会 有 进度 和 其 他 报告 。 所 有 这 些 错 
误 报 告 只 会 出 现在 shell 里 。 

$ erl -boot start sasl -config elogl 

1> error logger:error msg("This is an error\n"). 

=ERROR REPORT==== 15-JUL-2013: :11:53:08 === 

This 15S an error 

ok 


4. 文本 文件 和 shell 
接 下 来 的 配置 文件 会 在 shell 里 列 出 错误 报告 ， 所 有 的 进度 报告 则 会 保存 在 一 个 文件 里 。 











elog2.config 
%% 单 文本 文件 ， 最 小 化 tty 


[{sasl, [ 
%% ,所 有 的 报告 都 写 入 这 个 文件 
{sasl error logger, {file, "/Users/joe/error Logs/THELOG"}} 
]}]. 


要 测试 它 ， 我 们 可 以 启动 Erlang， 生 成 一 个 错误 消息 ， 然 后 查看 日 志文 件 。 


$ erl -boot start sasl -config elog2 

Erlang R16B (erts-5.10.1) [source] [smp:2:2] ，,， 
Eshell V5.10.1] (abort with ^G) 

1> error logger:error msg("This is an error\n"). 





=ERROR REPORT==== 26-May-2013::13:07:46 === 
This 1S an error 

OK 

如 末 现 在 查看 /Users/joe/error_ Logs/THEL0G， 就 会 发 现 它 的 开头 如 下 : 
=PROGRESS REPORT==== 15-Jul-2013::11:30:55 === 


supervisor: {local,sasl safe sup} 
started: [{pid,<0.34.0>}, 
{name,alarm handler}, 
{mfa, {alarm handler, start link,{]}}, 
{restart type,permanent}, 
{shutdown, 2000},， 
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{child type,worker}] 


里 只 列 出 了 进度 报告 ,而 它们 原本 应 该 出 现在 shell 里 。 进 度 报告 是 关于 大 事件 的 ， 比 如 启 
和 eo “logger:error msg/1 报 告 的 错误 没有 保存 在 日 志 里 , 为 此 我 们 
必须 配置 一 个 滚动 周二 JUNo 


。 5. 滚动 日 志和 和 shell 
下 面 的 配置 既 能 提供 shell 输 出 ， 又 能 把 写 和 信 shell 的 所 有 信息 复制 到 一 个 滚动 日 志文 件 里 。 











elog3.config 

%% 滚动 日 志和 最 小 化 tty 

[{sastl, [ 

{sasl error logger, false}, 

%% 定义 滚动 日 志 的 参数 

%% 日 志文 件 目录 

{error logger mf dir,"/Users/Joe/error Logs"}, 
%% # 每 个 日 志文 件 的 字 节 数 

{error logger mf maxbytes,10485760}, % 10 MB 
%% 日 志文 件 的 最 大 数量 

{error logger mf maxfiles, 10} 

}] 


erl -boot start sasl -config elog3 

Erlang R16B (erts-5.10.1) [source] [smp:2:2] 

Eshell V5.10.1 (abort with ^6) 

1> error logger:error msg("This is an error\n"). 

2> 

=ERROR REPORT==== 26-May-2013;:13:14:31 === 

This is an error 

日 志 的 最 大 文件 大 小 是 10MB， 达 到 10MB 时 会 回 绕 或 者 “ 深 动 "。 可 想 而 知 ， 这 是 一 个 

Pe 运行 系统 时 ， 所 有 的 错误 都 会 写 人 一 个 滚动 错误 日 志 。 我 们 会 在 本 章 后 面 看 
到 如 何 从 日 志 里 提取 错误 。 

6. 生产 环境 

在 生产 环境 里 , 我 们 真正 感 兴趣 的 只 有 错误 ， 而 非 进 度 或 信息 报告 , 所 以 只 让 错误 记录 共 报 

告 错 误 。 如 果 没 有 这 个 设置 ， 系 统 也 许 就 会 被 信息 和 进度 报告 所 济 没 。 








elog4.config 
5 和 5 滚动 日 志和 错误 

[{sSaSsL，[ 
% 最 小 化 Shell 错 误 记 录 
sasl error logger, false}, 
只 报告 错误 
errlog type, error}, 

定义 滚动 日 志 的 参数 

日 志文 件 目录 


oo do A oP 
oo 


oo 


oo 
oo 
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{error logger mf dir,"/Users/joe/error logs"}, 
%% 每 个 日 志文 件 的 字 节 数 
{error logger mf maxbytes,10485760}, % 10 MB 
%% 日 志文 件 的 最 大 数量 
{error logger mf maxfiles, 10} 
1}]. 
运行 它 会 产生 与 之 前 例子 类 似 的 输出 ， 区 别 在 于 错误 日 志 里 只 会 有 错误 报告 











分 析 错 误 
阅读 错误 日 记 古 rb 模块 的 责任 ， 它 的 接口 极其 侧 单 。 


$ erl -boot start sasl -config elog3 


1> rb:help!(). 
Report Browser Tool - usage 


2> rb:start() -~ start the rb server with default options 
rb:start(Options) - where Options is a list of: 
{start log, FileName} 
- default: standard io 
{max, MaxNoOfReports} 
- MaxNoofReports should be an integer or 
- default: all 


'all! 


, many Lines omitted .,， 


3> rb:start([{max,20}]). 
rb; reading report,,.done,. 





首先 必须 用 正确 的 人 动 Erlang， 这 样 才能 定位 错 


日 志 》 然后 











后 局 动 报 告 浏览 融 ， 告 


诉 它 要 读 取 多 少 日 志 条 目 ( 在 这 个 案例 里 是 最 后 20 条 )。 现 在 | 日 志 里 的 条 目 。 

4> rb:1list(). 

No Type Process Date Time 
12 progress <0.31.0> 2013-05-26 13:21:53 
11 progress <0.31.0> 2013-05-26 13:21:53 
10 progress <0.31.0> 2013-05-26 13:21:53 
9 progress <0.24.0> 2013-05-26 13:21:53 
8 error <0.25.0> 2013-05-26 13:23:04 
7 progress <0.31.0> 2013-05-26 13:23:58 
6 progress <0.31.0> 2013-05-26 13:24:13 
5 progress <0.31.0> 2013-05-26 13:24:13 
4 progress <0.31.0> 2013-05-26 13:24:13 
3 progress <0.31.0> 2013-05-26 13:24:13 
2 progress <0.24.0> 2013-05-26 13:24:13 
1 progress <0.31.0> 2013-05-26 13:24:17 


OO 
于- 
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调用 error logger:error msg/1 产 生 的 错误 日 志 条 目 消息 最 终 成 为 日 志 里 的 第 8 条 。 可 以 
像 这 样 检查 它 : 

> rb:show(8). 

ERROR REPORT <0.44.0> 2013-05-26 13:23:04 


This is an error 
ok 


分 离 出 茶 个 错误 ， a grep (RegExp) 这 样 的 命令 ， 它 会 找 出 所 有 匹配 正则 表达 
Re 我 不 想 主 尽 介 绍 如 何 分 析 错 误 日 志 ， 最 好 的 做 法 是 花 一 点 时 间 与 rb 交互 来 看 
看 它 能 做 什么 。 请 注意 ,实际 上 永远 不 需要 删除 任何 一 个 错误 报告 ， 因 为 滚动 机 制 最终 会 删除 那 
些 老 的 错误 报告 。 

如 果 想 保留 所 有 的 错误 日 志 ， 就 必须 定期 轮 询 错误 报告 并 移 除 你 感 兴趣 的 信息 。 














23.3 ”和 警报 省 理 


我 们 编写 的 应 用 程序 只 需要 一 个 警报 , 这 个 警报 会 在 CPU 因为 计算 超大 质 数 而 开始 熔化 时 抛 
出 〈 别 忘 了 我 们 正在 建设 一 家 销售 质数 的 公司 )。 这 次 将 使 用 真正 的 OTP 和 警报 处 理 需 〈 而 不 是 在 
人 的 简单 版 )。 
这 个 警报 处 理 希 是 OTPgen_event 行 为 的 回调 模块 ， 它 的 代码 如 下 。 

















my _alarm_handler.erl 


-module(my alarm handler). 
-behaviour (gen event). 


%% geNn eVeENnt 回 调 涵 数 
-export([init/l, code change/3, handle event/2, handle call/2, 
handle info/2, terminate/2]). 


%% linit(Args) 必 须 反 加 {ok，State} 

init(Args) -> 
jo:format("*** my atarm handler 1init:~p~n",[Args]), 
{ok, 0}., 


handle event({set alarm, tooHot}, N) -> 
error logger:error msg("*** Tell the Engineer to turn on the fan~n"), 
{ok, N+1}; 
handle event({clear alarm, tooHot}, N) -> 
error logger:error msg("*** Danger over, Turn off the fan~n"), 
{ok, N}; 
handle event (Event, N) -> 
jo:format{("*** yjnmatched event:~p~n", [Event])}), 
{ok, N}. 
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handle call{ Request, N) -> Reply = N, {ok, Reply, NN}. 
handle info(_ Info, N) -> {Ok, N}. 


terminate( Reason, _N) -> Ok, 
code change( OldVsn, State, Extra) -> {ok, State}. 


这 段 代 码 非常 像 之 前 在 22.3 节 里 看 到 的 gen server 回 调 人 代码。 其 中 值得 注意 的 方法 是 
handle event(Event，State) ， 它 应 当 人 返回 {ok，NewState}。Event 是 一 个 {EventType， 
Event-Arg} 形 式 的 元 组 ， 其 中 EventType 是 set_event 或 clear event， 而 EventArg 是 一 个 用 
户 提供 的 参数 。 稍 后 会 看 到 这 些 事 件 是 如 何 生成 的 。 

现在 来 找 点 乐子 : 启动 系统 ， 生 成 一 个 警报 ， 安 装 警报 处 理 器 ， 再 生成 一 个 警报 …… 


$ erL -boot start sasl -config elog3 

1> alarm handler:set alarm(tooHot). 

ok 

=INFO REPORT==== 15-Jul-2013::14:20:06 === 

alarm handler: {set,tooHot} 

2> gen event:swap_ handler(alarm handLer， 
{alarm handler, swap}, 
{my _ alarm handler, xyz}). 

*** my alarm handler init:{xyz, {alarm handler, [tooHot]}} 

3> alarm handler:set alarm(tooHot). 

ok 

=ERROR REPORT==== 15-Jul-2013::14:22:19 === 

*** Tell the Engineer to turn on the fan 

4> alarm handler:clear alarm(tooHot). 

ok 

=ERROR REPORT==== 15-JUul-2013::14:22:;39 === 

*** Danger over. Turn off the fan 


刚才 发 生 了 以 下 这 些 事情 。 

(1) 用 -boot start_sasl 局 动 了 Erlang。 这 人 么 做 就 得 到 了 一 个 标准 徊 报 处 理 剖 。 当 我 们 设置 
或 清除 警报 时 ， 什 么 事 都 不 会 发 生 。 这 就 类 似 于 之 前 讨论 过 的 “什么 都 不 干 ” 的 事件 处 理 硕 。 

(2) 设置 警报 〈 第 1 行 ) 后 只 得 到 了 一 个 信息 报告 。 这 个 警报 没有 得 到 特别 处 理 。 

(3) 安 猴 了 一 个 目 定 义 和 警报 处 理 术 (第 2 行 ) my_alarm_handtLer 的 参数 (xyz ) 没什么 特殊 
含义 ， 只 不 过 语法 要 求 这 里 有 一 个 值 。 但 因为 我 们 没有 用 值 而 是 用 了 原子 xyz， 所 以 能 在 参数 打 
印 出 来 时 识别 它 。 

** my alarm handler init: ,., 这 段 打 印 输出 来 自我 们 的 回调 模块 。 

(4) 设置 并 清除 了 一 个 tooHot 和 警报 (第 3 和 第 4 行 )。 目 定 义 警 报 处 理 囊 对 其 进行 了 处 理 ，shell 
打印 输出 能 证 明 这 一 点 。 




















读 取 日 志 


让 我 们 回 到 错误 记录 带 里 去 看 看 发 后 了 什么 。 
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1> rb:start([{max,20}]). 

rb: reading report...done. 

2> rb:list(). 

NO Type Process Date Time 


info report <0.29.0> 2013-07-30 14:20:06 
error <0O .29.0> 2013-07-30 14:22:19 


3 
2 
1 error <0.29.0> 2013-07-30 14:22:39 
3> rb:show(1). 


ERROR REPORT <0.33.0> 2013-07-30 14:22:39 


*** Danger over, Turn off the fan 

Ok 

4> rb:show(2). 

ERROR REPORT <0.33.0> 2013-07-30 14:22:19 


*** Tell the Engineer to turn on the fan 


可 以 看 到 错误 记录 机 制 运行 正常。 
在 实践 中 , 我 们 会 确 你 错误 日 志 大 到 足够 文 持 几 天 或 几 周 的 运作 。 每 隔 几 天 《或 几 周 ) 就 会 
检查 错误 日 志 并 调查 所 有 错误 。 





注意 ”rb 模块 里 有 一 些 函 数 能 选择 特定 类 型 的 错误 或 把 它们 提取 到 文件 里 。 因 此 ,分 析 错 误 日 
专 的 过 程 可 以 实现 完全 自动 化 。 


23.4 ”应 用 程序 服务 器 
我 们 的 应 用 程序 有 两 个 服务 天 个 质数 服务 器 和 一 个 面积 服务 器 





23.4.1 质数 服务 器 


是 质数 服务 右 的 代码 ， 它 是 用 gen server 行 为 编写 的 (参见 22.2 方 )。 请 注意 它 是 如 何 
纳入 我 们 在 前 一 广 中 开发 的 警报 处 理 函 数 的。 














prime_server.erl 


-module(prime server). 
-behaviour (gen server). 

-export([new prime/1, start link/01). 
%% gen SerVver 回 调 洱 数 


-export([init/l1, handle call/3, handle cast/2, handle info/2, 
terminate/2, code change/3]). 
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start link() -> 
gen server:start link({local, ?MODULE}, ?MODULE, [], []). 


New prime(N) -> 
和 % 20000 (ms) 是 一 个 超时 设置 
gen server:call(?MODULE, {prime, N}, 20000), 
init{({]) -> 
5 请 注意 ， 如 果 想 让 terminate/2 
和 5 在 应 用 程序 停止 时 被 调用 ， 就 必须 
% 设置 trap exit = true 


oP oo 


co8 


process flag(trap exit, true), 
io:format{"~p starting~n",[?MODULE}), 
{ok, 0}. 


handle call({prime, K}, From, N) -> 
{reply, make new prime(K), N+1}. 


handte cast( Msg, N) -> {noreply, N}. 
handle info{ Info，N) -> {noreply, N}. 


terminate( Reason, N) -> 
ijo:format("~p stopping~n" ,|[?MODULE]), 
OK ， 


code change{ OldVsn, N, Extra) -> {ok, N}. 


make new prime(K) -> 
if 
K > 100 -> 
alarm handler:set alarm(tooHot), 
N = lib primes:make prime(K), 
alarm handler:clear alarm(tooHot), 
N ; 
true -> 
Lib primes:make prime(K) 
end. 


23.4.2 ”面积 服务 器 





现在 轮 到 面积 服务 器 了 ， 它 也 是 用 gen_server 行 为 编写 的 。 请 注意 ， 用 这 种 方式 编写 服务 
估 速 度 极 快 ,我 在 编写 这 个 示例 时 瘟 切 粘贴 了 质数 服务 带 里 的 代码 ,然后 把 它 转 变 成 面积 服务 问 。 
这 只 用 了 几 分 钟 时 间 。 

这 个 面积 服务 套 不 是 全 世界 最 有 才 的 程序 ， 而 且 它 还 包含 一 个 故意 设置 的 错误 〈 你 能 找到 
吗 ? )。 我 的 计划 不 算 巧 妙 ， 就 是 为 了 让 服务 右 朋 演 然 后 被 监控 带 重 局。 此 外 ， 我 们 还 会 在 错误 
日 志 里 获得 天 于 这 一 切 的 报告 。 
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area server.erl 


-module(area server). 
-behaviour(gen server). 


-export([area/l1, start link/0]). 


%% gen SErVer 回 调 涵 数 
-export( [init/1, handle call/3, handle cast/2, handle info/2, 
terminate/2, code change/31). 


start link() -> 
gen server:start link({local, ?MODULE}, ?MODULE, [], [1). 


area(Thing) -> 

gen_server:call(?*MODULE, {area, Thing}). 
init([]) -> 
%% 请 注意 ， 如 果 想 让 terminate/2 
ss 在 应 用 程序 停止 时 被 铅 用 ， 就 有 
%% 设置 trap exit = true 
process flag(trap exit, true), 
ijo:format("~p starting~n",{[?MODULE]), 
{ok, 0}. 


handle call({area, Thing}, _From, N) -> {reply, compute area(Thing), N+1}. 
handle cast( Msg, N) -> {noreply, N}. 
handle info( Info, N) -> {noreply, N}. 
terminate( Reason, N) -> 
ijo:format("~p stopping~n",[?MODULE]), 
ok. 


code change( OldVsn, N, Extra) -> {ok, N}. 


compute area({square, X}) -> X*X; 
compute area({rectongle, X, Y}) -> X*Y, 


我 们 已 经 编写 完了 应 用 程序 代码 , 还 加 了 一 个 小 错误 。 现在 必须 设立 一 个 监控 结构 来 检测 不 
纠正 所 有 可 能 在 运行 时 发 生 的 错误 。 














23.5 ”监控 树 


监控 树 是 一 种 由 进程 组 成 的 树 形 结构 。 树 的 上 级 进程 (监控 融 ) 监视 着 下 级 进程 (工作 各 )， 
如 果 下 级 进程 挂 了 就 会 重启 它们 。 监 控 树 有 两 种 ， 如 图 23-1 所 示 。 
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一 对 一 监控 一 对 多 监控 
如 果 某 个 进程 崩溃 了 ， 就 会 被 重启 如 果 某 个 进程 崩溃 了 ， 


所 有 进程 都 会 被 终止 然后 重 局 


人 A 


23-1 


口 一 对 一 监控 树 
在 一 对 一 监控 里 ， 如 末 某 个 工作 需 朋 溃 了 ， 束 会 被 监控 需 重 局 。 
口 一 对 多 监控 树 
在 一 对 多 监控 里 ， 如 果 任 何 一 个 工作 兹 朋 演 了 ， 所 有 工作 进程 都 会 被 终止 (通过 调用 相 
应 回调 模块 里 的 terminate/2 函 数 ) 然后 重启 。 
监控 器 是 用 OTP supervisor 行 为 创建 的 。 这 个 行为 用 一 个 回调 模块 作为 参数 ， 里 面 指定 了 监 
控 过 上 略 以 及 如 何 启 动 监 控 树 里 的 各 个 工作 进程 。 监 控 树 通过 以 下 形式 的 函数 指定 
init(...) -> 
{ok, 1 


{RestartStrategy, MaxRestarts, Time}, 
[Workerl, Worker2, ...] 


}}, 

这 里 的 RestartStrategy 是 原子 one for one 或 one for all，MaxRestarts 和 Time 则 指 
定 “ 重 启 频 率 ”"。 如 有 果 一 个 监控 右 在 Time 秒 内 执行 了 超过 MaxRestarts 次 重启 ,那么 这 个 监控 带 
就 会 终止 所 有 工作 进程 然后 退出 。 这 是 为 了 防止 出 现 一 种 情形 ， 即 某 个 进程 朋 涡 、 被 重启 ， 然 后 
义 因 为 相同 原因 骨 沉 而 形成 的 无 限 循环 。 

Workerl 和 Worker2 这 些 是 描述 如 何 启 动 各 个 工作 进程 的 元 组 ， 稍 后 就 会 看 到 它们 。 

现在 回 到 公司 上 来 ， 同 时 构建 一 个 监控 树 。 

要 做 的 第 一 件 事 是 给 公司 选 一 个 名 字 , 我 们 决定 叫 它 seLLaprime。seLtLaprime 监 探 硕 的 工 
作 是 确保 质数 和 面积 服务 需 始 终 保持 运行 。 为 了 做 到 这 一 点 ， 我 们 将 编写 另 一 个 用 于 
gen_ supervisor 的 回调 模块 。 这 个 模块 的 代码 如 下 : 

















sellaprime_supervisor.erl 

-module(sellaprime supervisor). 

-behaviour (supervisor). 多 参见 erl -man supervisor 
-export([start/0, start in shell for testing/©0, start link/l1, init/1]). 
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start() -> 
spawn (fun() -> 
supervisor:start link({local,?MODULE}, ?MODULE, Arg = []) 
end). 
start_ in shell for testing() -> 
{ok, Pid} = supervisor:start link({local,?MODULE}, ?MODULE, Arg = []), 
unlink (Pid). 
start link(Args) -> 
supervisor:start link({local,?MODULE}, ?MODULE, Args). 
init([]) -> 
%% 安装 我 自己 的 错误 处 理 器 
gen_event :Swap_handLer(aLarm handLer， 
{alarm handler, swap}, 
{my _alarm handler, xyz}), 
{ok, {{one for one, 3, 10}, 
[{tagl, 
{area server, start link, []}, 
permanent, 
10000, 
worker., 
[area_ server]}, 
{tag2, 
{brime server, start link, []}, 
permanent, 
10000, 
worker, 
[prime server]} 


1}}. 
重点 部 分 是 init/1 返 回 的 数据 结构 。 


sellaprime_supervisor.erl 


{ok, {{one for one, 3, 10}, 

[{tagl, 
{area server, start link, []}, 
permanent, 
10000 ， 
worker, 
[area server]}, 

{tag2, 
{prime server, start link, [1]}, 
permanent, 
10000 ， 
worker, 
[prime server]} 


1]}}. 


这 个 数据 结构 定义 了 一 种 监控 案 略 。 之 前 讨论 过 监控 条 略 和 重 局 频率 , 现在 剩 下 的 就 是 面积 
服务 般 和 质数 服务 从 的 局 动 格式 了 。 
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Worker 的 格式 是 下 面 这 种 元 组 : 


{Tag, {Mod, Func, ArgList}, 
Restart, 
Shutdown, 
Type, 
[Mod1]} 


这 些 参数 的 意义 如 下 。 
DTag 


这 是 一 个 原子 类 型 的 标签 ， 将 来 可 以 用 它 指 代 工作 进程 〈 如 采 有 必要 的 话 )。 
DQ {Mod, Func, ArgList} 
它 定义 了 监控 需 用 于 局 动工 作 需 的 函数 ， 将 被 用 作 appLy(Mod，Fun，ArgList) 的 参数 。 
DRestart = permanent | transient | temporary 
permanent (永久 ) 进程 总 是 会 被 重启 。transient (过渡 ) 进程 只 有 在 以 非 正 常 退出 值 
终止 时 才 会 被 重启 。temporary (临时 ) 进程 不 会 被 重启 。 
DD Shutdown 
这 是 关闭 时 间 ， 也 就 是 工作 右 终 止 过 程 允许 耗费 的 最 长 时 间 。 如 来 超过 这 个 时 间 ， 工 作 
进程 就 会 被 杀 掉 。( 还 有 其 他 值 可 用 ， 参 见 supervisor 的 手册 页 。) 
DType = worker | supervisor 
这 是 被 监控 进程 的 类 型 。 可 以 用 监控 进程 代 蔡 工作 进程 来 构建 一 个 由 监控 右 组 成 的 树 。 
D [Mod1] 
如 有 果子 进程 是 监控 带 或 者 gen_server 行 为 的 回调 模块 ,就 在 这 里 指定 回调 模块 名 。( 还 有 
其 他 值 可 用 ， 参见 supervisor 的 手册 页 。) 
这 些 参数 看 上 去 很 吓人 , 但 其 实 不 是 。 在 实践 中 , 你 可 以 剪 切 粘 贴 之 症 面 积 服 务 帮 代 码 里 的 
值 ， 然 后 插入 你 的 模块 名 。 这 对 大 多 数 用 途 来 说 足够 了 。 


23.6 ”启动 系统 


现在 万 事 俱 备 ， 我 们 的 公司 可 以 开张 了 。 好 戏 开 始 ， 看 看 有 谁 想 灭 第 一 个 质数 ! 
首先 来 局 动 系统 。 


$ erl -boot start sasl -config elog3 

1> sellaprime supervisor:start in shell for testing(). 
*** my alarm handler init:{xyz,1{alarm handler,[]}} 
area server starting 

prime_server starting 


现在 生成 一 个 有 效 查 询 。 


2> area server'area({square,10}). 
100 
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监控 策略 是 否 奏效 
Erlang 被 设计 用 来 编写 容错 式 系统 。 它 最 初 是 在 瑞典 电信 公司 爱立信 的 计算 机 科学 实验 室 
里 开发 的 。 从 那 时 起 ， 爱 立信 的 OTP 团 队 在 许多 内 部 用 户 的 帮助 下 接 过 了 开发 任务 。 通 过 使 用 
gen server 和 gen supervisor 等 行为 ,人们 用 Erlang 构 建 了 可 靠 性 为 99.9999999% 的 系统 (9 
个 9 )。 如 果 用 法 正确 ， 错 误 处 理 机 制 能 帮助 你 的 程序 永久 运行 (好 吧 ， 几 乎 永久 运行 )。 这 里 
介绍 的 错误 记录 器 已 经 在 线 上 产品 里 运行 多 年 了 。 


现在 生成 一 个 无 效 查 询 。 


3> area server:area({rectangle,10,20}). 
area server stopping 


=ERROR REPORT==== 15-Jul-2013::15:15:54 === 
** Generic server area server terminating 
** Last message in was {area, {rectangle,10,20}} 
** When Server state == 
** Reason for termination == 
** {function clause, [{area server,compute area, [{rectangle, 10,20}]}, 
{area server,handle call,3}, 
{gen server,handle msg,6}, 
{proc lib,init p,S5S}]} 
area server starting 
** exited: {{function clause, 
[{area server,compute area, [{rectangle, 10,20}]}, 
{area server,handle call,3}, 
{gen server,handle msg,6}, 
{proc Lib,init p,5}]}, 
{gen server,call, 
[area server, {area, {rectangle,10,20}}]}} ** 


不 好 ,面积 服务 费 骨 演 了 , 我 们 触发 了 有 意 设 置 的 错误 。 监 控 妖 检测 到 这 次 月 演 并 重启 了 面 
积 服务 硕 。 所 有 这 些 都 被 错误 记录 禹 记录 下 来 ,我 们 也 看 到 了 这 个 错误 的 打印 输出 。 钳 误 消 息 显 
示 出 问题 所 在 : 程序 尝试 执行 area server:compute area({rectangle,10,20}) 时 月 当 了 ， 
也 就 是 错误 消息 function clase 的 第 一 行 所 展示 的 。 和 错误 消息 的 格式 是 {Mod, Func, [Args]}。 回 
去 看 看 前 几 页 里 定义 面积 计算 的 部 分 (在 compute area/1 里 )， 应 该 能 找到 这 个 错误 。 

有 骨 演 发 生 后 ， 一切 都 恢复 正常 ， 束 像 构 想 的 那样 。 接 下 来 生成 一 个 合法 请 求 。 


4> area server:area({square,25}). 
625 


系统 又 能 正常 工作 了 。 现 在 来 生成 一 个 小 质数 。 


5> prime server:new prlme(20) ， 
Generating a 20 digit prime ........ 
37864328602551726491 























再 生成 一 个 大 质数 。 


6> prime server:new prime(120). 
Generating a 120 digit prime 


=ERROR REPORT 


15-Jul-2013::15:22:17 === 


*** Tell the Engineer to turn on the fan 


=ERROR REPORT 


*** Danger over. Turn off the fan 


15-Jul-2013: :15:22:20 === 
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765525474077993399589034417231006593110007130279318737419683 
288059079481951097205184294443332300308877493399942800723107 


现在 我 们 有 T 了 一 个 能 正常 运行 的 系统 。 如 琳 攻 个 服务 冀 朋 演 了 ， 束 会 被 目 动 重 局 , 错误 日 志 
里 则 会 有 关于 这 个 错误 的 信息 。 来 看 一 下 错误 日 志 。 


了 > rb:start([{max,20}]). 


rb: reading report...done. 
rb: reading report...done. 


{ok, <0.53.0>} 
2> rb:1list(). 


No Type Process Date Time 

20 progress <0.29.0> 2013-07-30 15:05:15 
19 progress <0.22.0> 2013-07-30 15:05:15 
18 progress <O .23.0> 2013-07-30 15:05:21 
17 supervisor_ report <O .23.0> 2013-07-30 15:05:21 
16 error <0.23.0> 2013-07-30 15:07:07 
15 error <0.23.0> 2013-07-30 15:;07:23 
14 error <0.23.0> 2013-07-30 15:;07:41 
13 progress <0.29.0> 2013-07-30 15:15:07 
12 progress <0.29.0> 2013-07-30 15:;15:07 
11 progress <0.29.0> 2013-07-30 15:15:07 
10 progress <0.29.0> 2013-07-30 15:;15:07 
9 progress <0.22.0> 2013-07-30 15:;15:07 
8 progress <0.23.0> 2013-07-30 15:15:13 
7 progress <0.23.0> 2013-07-30 15:]15:13 
6 error <0.23.0> 2013-07-30 15:15:54 
crash report area server 2013-07-30 15:15:54 
4 supervisor report <0.23.0> 2013-07-30 15:;15:54 
3 progress <0.23.0> 2013-07-30 15;15:54 
2 error <0 .29.0> 2013-07-30 15:22:17 
1 error <0 .29.0> 2013-07-30 15:22:20 


有 地 方 出 问题 了 。 我 们 能 看 到 一 个 面积 服务 亿 的 错误 报告 。 要 想 查 明 发 生 了 什么 , 可 以 查看 


错误 报告 。 
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9> rb:show{(5). 


CRASH REPORT <0.,43.0> 2013-07-30 15:15:;54 


Crashing process 
pid < .43.0> 
registered name area server 
error_info 
{function clause, [{area server,compute area,[{rectangle,10,20}]1}, 
{area server,handle call,3}, 
{gen server,handle msg,6}, 
{proc Lib,init p,5}]} 


initial catl 
{gen,1init it, 

[gen_ server, 
< 日 ,42 ,和 > ， 
< 日 .42 .0>， 
{local,area server}, 
area_server., 
[]， 
[] 1}} 

ancestors 

messages 

links 

dictionary 

trap exit 

status 

heap_size 

stack size 

reductions 

ok 


打印 输出 {function clause，compute area，...} 展 示 了 程序 里 导致 服务 器 月 演 的 准确 
位 置 。 定 位 和 纠正 这 个 错误 应 该 是 件 简 单 的 事 。 再 看 一 下 后 面 这 些 错误 。 


[sellaprime supervisor,<0.40.0>] 
[] 

[<0 ,42.0>] 

[] 

false 

running 

233 

21] 

199 








10> rb:show(2). 


ERROR REPORT <0.33.0> 


2013-07-30 15:22:17 


*** Tell the Engineer to turn on the fan 


以 及 


10> rb:show(1)}). 


ERROR REPORT <0.33.0> 


2013-07-30 15:22:20 


水 冰冰 Danger over, Turn off the fan 











这 些 是 因为 计算 的 质数 过 大 而 引发 的 风衣 警报 ! 
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23.7 ”应 用 程序 











我 们 差不多 已 经 完工 了 上。 现在 要 做 的 是 编写 一 个 扩展 名 为 ,app 的 文件 ， 它 包含 关于 这 个 应 





用 程序 的 信息 。 


sellaprime.app 


%%5 这 是 应 用 程序 资源 文件 〈.app 文 件 ) ， 
%% 人 它 用 于 base ' 应 用 程序 。 
{application, sellaprime, 
[{description, "The Prime Number Shop"}, 
{vsn, "1.0"}, 
{modules, [sellaprime app, sellaprime supervisor, area server, 
prime server, lib tin, lib primes, my alarm handterj}， 
{registered, [area server, prime server, sellaprime super}l}, 
{applications, {kernel,stdlib]}, 
{mod, {sellaprime app,[]}}, 
{start phases, []} 
]}. 


现在 必须 编写 一 个 回调 模块 ， 它 的 名 称 与 前 面 文件 里 的 mod 文 件 名 相同 。 这 个 文件 取 上 月 A.3 








节 里 的 模板 ， 然 后 加 以 填写 。 


sellaprime_app.erl 


-module(sellaprime app). 
-behaviour(application). 
-export([start/2, stop/1]). 
start( Type, StartArgs) -> 

sellaprime supervisor:start link(StartArgs). 
stop( State) -> 

Ook. 


它 必须 导出 函数 start/2 和 stop/1。 做 完 这 一 切 之 后 , 就 可 以 在 shell 里 启动 和 停止 应 用 程序 


$ erl -boot start sasl -config elog3 

1> application:loaded applications(). 
[{kernel,"ERTS CXC 138 10","2.16.1"}, 
{sasl, "SASL CXC 138 11","2.3.1"}, 

{stdlib, "ERTS CXxC 138 10","1.19.1"}] 

2> application:load(sellaprime). 

ok 

3> appLication:Loaded applications(). 
[{sellaprime, "The Prime Number Shop","1.0"}, 
{kernel, "ERTS CXC 138 10","2.16.1"}, 
{sasl, "SASL CXC 138 11","2.3.1"}, 
{stdlib,"ERTS CXC 138 10","].,19.1"}] 

4> application:start(sellaprime). 

*** my _alarm handler init:{xyz,{alarm handler,[]}} 
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area server starting 

prime server starting 

ok 

5> application:stop(sellaprime). 
prime server stopping 

area_ server stopping 


=INFO REPORT==== 26-May-2013::14:16:57 === 
application: sellaprime 

exited: stopped 

type: temporary 

ok 

6> application:unload(sellaprime). 

ok 

7> application:Tloaded applications(). 
[{kernel, "ERTS CXC 138 10","2.16.1"}, 
{sasl,'"SASL CXC 138 11","2.3.1"}, 
{Stdlib,"ERTS CXC 138 10","1.19.1"}] 


现在 它 就 是 一 个 功能 完备 的 OTP 应 用 程序 了 。 我 们 在 第 2 行 里 载 入 了 应 用 程序 ， 这 人 么 做 会 载 
入 全 部 代码 ,但 不 会 局 动 应 用 程序 。 第 4 行 局 动 了 应 用 程序 ， 第 5 行 则 集 止 了 它 。 请 注音 ,局 动 和 
集 止 应 用 程序 时 我 们 能 看 到 打 吨 输出 ， 因 为 它 调 用 了 面积 服务 各 和 质数 服务 帮 里 相应 的 回调 也 
数 。 在 第 6 行凶 载 了 应 用 程序 ， 这 样 应 用 程序 里 的 所 有 模块 代码 都 被 移 除 了 。 

用 OTP 构 建 复杂 的 系统 时 , 会 把 它们 打包 成 应 用 程序 。 这 样 我 们 就 能 统一 启动 、 停 止 和 管理 
它们 。 

请 注意 ， 用 init:stop() 关 闭 系统 时 ， 所 有 运行 中 的 应 用 程序 会 按 顺 序 一 一 关闭 。 

$ erl -boot start sasl -config elog3 

1> application:start(sellaprime). 

*** my _ alarm handler init:{xyz,{alarm handter，[ 

area server starting 

prime server starting 

ok 

2> init:stop(). 

ok 

prime server stopping 

area server stopping 


$ 

命令 2 后 面 的 两 行文 本 来 自 面积 与 质数 服务 器 ， 这 就 表示 各 个 gen_server 回 调 模 块 里 的 
terminate/2 国 数 都 得 到 了 调用 。 
23.8 文件 系统 组 织 方式 


我 还 没有 提 到 过 文件 系统 的 组 织 方式 ， 这 是 有 原因 的 ， 我 的 目的 是 每 次 只 解决 一 个 问题 。 
规范 的 应 用 程序 各 个 部 分 所 属 的 文件 通常 都 处 于 定义 明确 的 位 置 。 这 不 是 必要 条 件 , 只 要 相 
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天 文件 能 在 运行 时 找到 ， 文 件 是 如 何 组 织 的 并 不 重要 。 
我 把 本 书 的 大 多 数 演 示 文 件 都 放 在 同一 个 目录 里 。 这 人 么 做 简化 了 示例 , 也 避 锡 了 搜索 路 径 和 
不 同 程序 之 间 的 交互 等 问题 。 





sellaprime 公 司 使 用 的 主要 文件 如 下 。 





文件 内 容 

area server.erl 面积 服务 器 ( gen server 回 调 模块 ) 
prime server.erl 质数 服务 器 ( gen server 回 调 模 块 ) 
sellaprime supervisor.erl 蚌 控 器 回调 模块 

sellaprime app.erl 应 用 程序 回调 模块 

my alam handler.erl 用 于 gen_event 的 事件 回调 模块 
sellaprime.app 应 用 程序 规范 

elog4.config 错误 记录 带 配 置 文件 





要 了 解 这 些 文件 和 模块 是 如 何 使 用 的 ， 可 以 来 看 看 局 动 应 用 程序 时 发 生 的 事件 序列 。 
(1) 用 下 列 命令 启动 系统 : 


$ erl -boot start sasl -config elog4.config 
1> application:start(sellaprime)., 











seLLaprime.app 文 件 必须 位 于 Erlang 的 启动 根 目录 或 它 的 子 目录 里 。 

应 用 程序 控制 硕 随 后 在 seLLaprime.app 里 寻找 一 个 {mod，. . .} 声 明 。 它 包含 应 用 程序 控制 
顺 的 名 称 ， 在 这 个 案例 里 是 模块 seLLaprime_app。 

(2) 回调 方法 seLLaprime app:start/2 被 调用 。 

(3) sellaprime app:start/2 调用 sellaprime supervisor:start Link/2 ， 启 动 
seLLaprime 监 控 器 。 

(4) 监控 需 回 调 亲 数 seLLaprime supervisor:init/1 被 调用 ， 它 会 安装 一 个 错误 处 理 表 ， 
然后 返回 一 个 监控 规范 。 这 个 监控 规范 说 明了 如 何 局 动 面 积 服 务 关 和 质数 服务 天。 

(5) sellaprime 监 探 硕 启动 面积 服务 兹 和 质数 服务 硕 ， 两 者 都 是 gen server 的 回调 模块 。 

停止 这 一 切 很 容易 ， 只 需要 调用 appLication:stop(seLLaprime) 或 init:stop()。 


23.9 ”应 用 程序 监视 器 


应 用 程序 监视 器 是 一 个 用 来 查看 应 用 程序 的 GUI。appmon:start() 命 令 会 启动 应 用 程序 
看 器 。 输 入 这 个 命令 后 ， 你 会 看 到 一 个 如 图 23-2 所 示 的 窗口 ， 必 须 点 击 一 个 应 用 程序 才能 进行 
看 。 图 23-3 展 示 了 应 用 程序 seLLaprime 在 应 用 程序 监视 器 里 的 样子 。 
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Ee APPMON: OvervieW on nonode®@nohost |_Ox 
File Actions Options Nodes Help | 








sellaprime_superyisor 


area_server | | prime_ server 





图 23-3 ”sellaprime 应 用 程序 


23.10 ”怎样 计算 质数 
计算 质数 很 简单 。 代 码 如 下 : 
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lib_primes.erl 


Line1 -module(lib primes). 
-export([make prime/1, is prime/l1, make_ random int/1]). 


- make prime(1) -> 


5 lists:nth(random:uniform(4), [2,3,5,7]); 
- make prime(K) when K>0 -> 
new_seed(), 
N = make_random_ int(K), 
if N>3 -> 
10 io:format("Generating a ~w digit prime ",[K]), 


MaxTries = N - 3, 
Pl = make prime(MaxTries, N+1), 
io:format("~n",[]), 
Pp1; 
15 true -> 
make_prime(K) 
end . 


- make_prime(0，_) -> 
20 exit(impossible); 
- make prime(K, P) -> 
lio:format(".",[]), 
case is prime(P) of 
true -> P; 
25 false -> make prime(K-1, P+1) 
end. 


- is prime(D) when D < 10 -> 
lists:member(D, [2,3,5,7]); 
30 is prime(D) -> 
new_seed(), 
ls prime(D, 100). 





- 1s prime(D, Ntests) -> 
35 N = length(integer to list(D)) -1， 
ls prime(Ntests, D, N). 


- ls prime(0, , ) -> true,; 
- 1s prime(Ntest, N, Len) -> 
40 K = random:uniform(Len), 


%% 人 A 是 一 个 小 于 K 的 随机 数 
A = make_random int(K), 


1f 
A<N -> 
45 case Lib lin:pow(A,N,N) of 
A -> is prime(Ntest-1,N,Len); 
_ -> false 


end; 
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true -> 
50 is prime(Ntest, N, Len) 
end., 


%% make random int(N) -> 一 个 N 位 的 随机 整数 
- make random int(N) -> new seed(), make random int(N, 0)., 
55 
- make random int(0, D) -> D; 
- make random int(N, D) -> 
make_random int(N-1, D*]10 + (random:uniform(10)-1)). 


make_prime(K) 返 回 一 个 至 少 K 位 的 质数 。 为 了 做 到 这 一 点 ， 我 们 使 用 一 种 基于 Bertrand 假 
说 的 算法 。Bertrand 假 说 是 指 对 任意 自然 数 N > 3， 都 有 一 个 质数 P 满 足 N< P < 2N - 2。Tchebychef 
在 1850 年 证 明了 它 ，Erdos 在 1932 年 对 证 明 做 了 改进 。 

并 先生 成 一 个 N 位 的 随机 整 长 数 ( 第 54~58 行 )， 然 后 测试 N+1 和 N+2 等 数字 是 否 是 质数 。 这 是 在 
第 19~26 行 的 循环 里 完成 的 。 

is_prime(D) 会 在 D 很 可 能 是 质数 时 返回 true， 否 则 返回 false。 它 运用 了 费 马 小 定理 : 如 
果 N 是 质数 且 A < N， 那 么 AN mod N = A。 因 此 ,为 了 测试 N 是 否 是 质数 ， 我 们 生成 小 于 N 的 随 
机 值 A 并 运行 费 马 测试 。 如 有 果 测 试 失败 ，N 就 不 是 一 个 质数 。 这 是 一 种 概率 性 测试 ， 所 以 每 运行 一 
次 测试 ，N 是 质数 的 概率 就 会 增加 。 测 试 是 在 第 38~51 行 里 执行 的 。 

是 时 候 生 成 一 些 质 数 了 。 

1> Lib primes:make prime(500)., 

Generating a 500 digit prime Gyovovisiro oi 

7910157269872010279090555971150961269085929213425082972662439 

1259263140285528346132439701330792477109478603094497394696440 

4399696758714374940531222422946966707622926139385002096578309 

0625341667806032610122260234591813255557640283069288441151813 

9110780200755706674647603551510515401742126738236731494195650 

5578474497545252666718280976890401503018406521440650857349061 

2139806789380943526673726726919066931697831336181114236228904 


0186804287219807454619374005377766827105603689283818173007034 
0262052784123 


我 们 已 经 概述 了 构建 OTP 应 用 程序 的 基础 知识 。OTP 应 用 程序 有 标准 化 的 文件 格式 ， 启动 和 
停止 的 方式 也 很 规则 。 它们 通常 包括 一 个 被 gen_ ee server， 外 加 一 些 错 误 
记录 代码 。 可 以 在 Erlang 分 发 套装 的 网 站 上 找到 所 有 关于 OTP 行 为 的 完整 介绍 。 


23.11 次 入 探索 


我 在 这 里 省 略 了 很 多 ， 只 解释 了 相关 的 原则 。 你 可 以 在 gen event、error logger、 
ee 1 里 找到 详细 介绍 。 
更 多 OTP 设 计 原则 的 细节 可 以 在 Erlang/OTP 系 统 文档 "里 找到 。 





























GD http:/www.erlang.org/doc/pdf/otp-system-documentation.pdf 
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在 目前 这 个 阶段 ， 我 们 已 经 涉及 了 构建 兼容 OTP 框 架 的 常规 Erlang 应 用 程序 所 需要 的 全 部 重 
在 本 书 最 后 一 部 分 , 我 们 将 跳出 OTP 和 框架, 向 你 展示 一 些 额 外 的 编程 技巧 并 构建 复杂 的 示例 
程序 © 








23.12 练习 


浏览 这 些 练习 时 请 别 担心 。 当 你 到 达 清 单 最 后 的 问题 时 , 将 会 面临 一 个 难度 很 高 的 问题 。 要 
解决 它 ， 你 需要 了 解 OTP 行 为 ( 本草 和 上 一 章 )， 理 解 如 何 使 用 Mnesia ( 用 于 数据 复制 )， 还 要 对 
分 布 式 Erlang 有 基本 的 了 解 〈 如 何 设立 连接 节点 ) 

这 些 主题 单独 看 来 并 不 算 特 别 复杂 。 寿 把 简单 的 事物 组 合 到 一 起 , 最 终 表 现 出 的 行为 就 可 能 
会 非常 复杂 。 即使 你 不 去 立即 解决 这 些 问 题 , 单单 思考 它们 也 能 帮助 你 把 这 类 问题 的 解决 方案 分 
解 成 可 驾驭 的 几 个 部 分 。 要 构建 大 型 的 容错 式 系 统 , 我 们 需要 考虑 服务 部 该 做 什么 ， 如 何 重 局 毅 
溃 的 服务 硕 ， 如 何 进行 负载 均衡 ， 如 何 / 回 何 处 复制 数据 等 问题 。 这 些 练 习 的 排列 顺序 能 指引 你 
逐步 完成 这 个 过 程 。 

(1) 制作 一 个 名 为 prime tester _ server 的 gen server， 让 它 测试 给 定 的 数字 是 否 是 质数 。 
你 可 以 使 用 lib _ primes.ert 里 的 is_prime/2 图 数 来 处 理 ( 或 者 目 己 实现 一 个 更 好 的 质数 测试 函 
数 )。 把 它 添加 到 sellaprime supervisor.erl 的 监控 树 里 。 

(2) 制作 由 10 个 质数 测试 服务 帮 组 成 的 进程 池 。 制 作 一 个 队列 服务 帮 来 把 请 求 加 入 队列 ， 直 
到 其 中 一 个 质数 测试 服务 硕 处 于 空闲 状态 为 止 。 当 质数 测试 服务 希 空闲 时 , 回 它 发 送 一 个 请 求 来 
测试 某 个 数字 是 否 是 质数 。 

(3) 修改 质数 测试 服务 妖 的 代码 ， 让 它们 各 目 维 护 一 个 请 求 队列 ， 然 后 移 除 队列 服务 带 。 编 
写 一 个 负载 均衡 希 来 记录 各 个 质数 测试 服务 硕 中 正在 进行 的 任务 和 符 完 成 请 求 。 测 试 新 质数 的 请 
求 现 在 应 该 发 送 到 负载 均衡 硕 。 安 排 负 载 均 衡 希 把 请 求 发 送 给 负载 最 小 的 服务 顺 。 

(4) 实现 一 种 监控 层级 体系 ， 使 任何 质数 测试 服务 需 导 省 后 都 能 被 重启 。 如 果 人 负载 均 衔 希 天 
溃 了 ， 就 让 所 有 质数 测试 服务 融 都 朋 溃 ， 然 后 全 体重 局 。 

(5) 使 全 体重 启 所 需 的 数据 在 两 台 机 右上 同步 复制 。 

(6) 实现 一 种 重启 策略 ， 使 整 台 机 妖 朋 沉 后 也 能 全 体重 启 。 












































”第 五 部 分 
构建 应 用 程序 


在 这 一 部 分 里 ， 我 们 将 会 看 到 一 些 编写 Erlang 
程序 时 常用 的 编程 术语 ， 还 会 了 解 如 何 把 第 三 方 代 
码 集成 到 我 们 的 应 用 程序 里 ， 相 比 由 自己 完成 所 有 
工作 ， 这 种 方式 能 更 快 得 到 结 末 。 我 们 还 将 学 习 如 
何 让 程序 在 多 核 计算 机 上 并 行 。 最 后 ， 将 解决 福 尔 
摩 斯 的 最 后 一 案 。 








编程 术语 





本 章 将 探究 一 些 编程 术语 并 介绍 Erlang 代 码 的 不 同 组 织 方式 。 我 们 将 从 一 个 示例 人 手 ， 展 示 
应 该 如 何 看 每 编程 世界 以 及 在 这 个 世界 里 所 见 到 的 对 和 象 。 


24.1 保持 Erlang 世界 观 


Erlang 的 世界 观 是 一 切 都 是 进程 和 进程 只 能 通过 交换 消息 进行 互动 。 这 种 世界 观 让 我 们 的 设 
计 具 备 了 概念 完整 性 ， 也 更 易于 理解 。 

假设 想 用 Erlang 编 写 一 个 Web 服 务 硕 。 有 一 位 用 户 回 我 们 的 Web 服 务 硕 请 求 一 个 名 为 
hetLto .htmL 的 网 页 。 最 简单 的 Web 服 务 硕 如 下 : 


web Server(CLient) -> 
receive 
{Client, {get, Page}} -> 
case file:read(Page) of 

{ok, Bin} -> 
Client ! {self(), {data, Bin}}; 

{error, } -> 
Client ! {self(), error} 

















end, 
web server(Client) 
end. 


但 这 上 段 代 人 码 如 此 简单 是 因为 它 只 接收 和 发 送 Erlang 数 据 类 型 ， 客 户 端 发 送 的 可 不 是 Erlang 数 
据 类 型 ， 而 是 复杂 程度 远 超前 者 的 HTTP 请 求 。HTTP 请 求 建 立 在 TCP 连 接 上 ,请 求 自身 也 可 能 会 
分 段 发 送 ， 所 有 这 一 切 都 使 得 服务 需 程 序 的 复杂 程度 撑 超 之 前 所 展示 的 简单 代码 。 

为 了 让 事情 更 简单 ,我们 在 Erlang 服 务 器 和 接收 HTTP 客 户 端 消 息 的 TCP 驱 动 之 间 插 入 一 个 名 
为 中 间 人 的 进程 。 中 间 人 会 解析 HTTP 请 求 ， 并 把 它们 转变 成 Erlang 消 息 ， 如 图 24-1 所 示 。 可 以 看 
出 翻译 进程 为 何 被 称 作 中 间 人 ， 它 就 位 于 TCP 驱 动 和 Web 服 务 顺 中 间 。 

对 服务 器 来 说 ， 外 部 世界 里 的 对 象 只 会 “说 ”Erlang 语 言 。 相 比 用 一 个 进程 做 两 件 事 (处理 
HTTP 请 求 和 服务 请 求 )， 我 们 现在 有 了 两 个 角色 定义 明确 的 进程 。 中 间 人 只 知道 如 何 转换 HTTP 
消息 和 Erlang 消 息 ， 而 服务 器 对 HTTP 协 议 的 细节 一 无 所 知 ， 只 负责 处 理 纯 Erlang 消 息 。 把 进程 一 
分 为 二 不 仅 让 设计 更 清晰 , 还 有 一 个 额外 的 好 处 : 它 可 以 增加 并 发 性 , 这 两 个 进程 可 以 并 行 执行 。 
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本 中 间 人 人 Web 服 务 磺 


HTTP 消 息 Erlang 消 息 
图 24-1 
图 24-2 展 示 了 与 处 理 HTTP 请 求 有 关 的 消息 流 。 


TCP 套 接 字 中 间 人 服务 器 


GET /~joe/hello.html HTTP/1.1 
User-Agent: ... 

Host: www.sics.se 

Accept: */* 


{get,"hello.html"} 


{data,<<"hello">>} 


HTTP/1.1 200 OK 

Date: Fri, 26 Feb 2013 13:20:06 GMT 
Server: Erlang home brew 
Accept-Ranges: bytes 
Content-Length: 4898 

Connection: close 

Content-Type: text/html 


hello 





图 24-2 Web 服务 器 协议 


中 间 人 的 确切 工作 原理 不 属于 我 们 的 讨论 范围 。 它 要 做 的 就 是 解析 传人 的 HTTP 请 求 ， 把 它 
们 转换 成 Erlang 数 据 类 型 ， 并 把 传 出 的 Erlang 数 据 类 型 转换 成 HTTP 响 应 。 

在 这 个 例子 里 ， 我 们 选择 抽象 掉 HTML 请 求 的 许多 细节 。HTML 请 求 头 包含 了 许多 没有 在 此 
展示 的 额外 信息 。 作 为 中 间 人 设计 的 一 部 分 ， 必 须 决 定 要 对 Erlang 应 用 程序 暴露 多 少 底层 协议 的 
细 市 。 

假设 想 要 扩展 这 个 例子 , 让 它 能 啊 应 FTP 文 件 请 求 或 通过 IRC 信 道 发 送 的 文件 。 可 以 癌 图 24-3 
所 展示 的 那样 组 织 系统 里 的 进程 。 

HTTP、FTP 和 了 JIRC 使 用 完全 不 同 的 协议 进行 机 需 间 的 文件 传输 。 事 实 上， 了 下 C 不 文 持 文件 传 
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输 ， 文 件 传 输 通 常 由 直接 并 对 并 ( Direct Client to Client， 简 称 CDC ) 协议 实现 ， 而 大 多 数 IRC 客 
户 妆 都 支持 这 个 协议 。 


HTTP 
得 到 请 求 






Erlang 消 息 









{get, File} 


FTP 
得 到 请 求 










{get, File} 


文件 服务 如 





{get, File} 
IRC 


得 到 请 求 





网 24-3 下 上 县 统一 化 


当中 间 人 把 这 些 外 部 协议 转换 成 Erlang 消 明 后 ， 束 可 以 把 单个 Erlang 服 务 带 用 作 所 有 不 同 协 
议 的 后 端 了 。 

统一 化 的 Erlang 消 息 硝 实 简化 了 实现 工作 ， 它 有 以 下 一 些 优 点 。 

口 它 抽象 掉 了 不 同 线路 协议 〈 比如 HITP 和 FTP 协 议 ) 之 间 的 区 别 。 

口 Erlang 消 息 无 需 解析 ， 接 收 进程 不 必 乞 解析 消息 再 处 理 它 。 相 比 之 下 ，HTTP 服 务 春 就 必 
须 解 析 接 收 到 的 所 有 消 县 。 

口 Erlang 消 息 可 以 包含 任意 复杂 度 的 数据 类 型 。 相 比 之 下 ，HTTP 消 息 必 须 被 序列 化 成 局 平 
的 形式 才能 传输 。 

口 Erlang 消 息 可 以 在 处 理 融 之 间 传 送 ， 或 者 以 一 种 徐 单 通用 的 序列 化 格式 保存 在 数据 库 里 。 


24.2 ”多 用 途 服 务 器 


据 径 了 各 种 服务 需要 不 同 的 消息 格式 这 一 概念 后 ， 婚 可 以 用 消息 统一 化 来 解决 多 种 问题 了 。 
例如 ， 这 里 有 一 个 “多 用 途 服 务 珊 ”: 











multi server.erl 


Line1 -module(multi server). 
- -export([start/0]). 
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- Start() -> Spawn(fun() -> multi server() end ) ， 
5 
- multi server() -> 
receive 
{_Pid, {email, From, Subject, Text} = Email} -> 
- {ok, S} = file:open("mbox", [write,append]), 
10 ijo:format(S, "~p.~n", [Email]), 
file:close(S); 
{_Pid, {im, From, Text}} -> 
ljo:format("Msg (~s): ~s~n",[From, Text]); 
- {Pid, {get, File}} -> 
15 Pid ! {self(), file:read file(File)}; 
Any -> 
ijo:format("multi server got:~p~n",[Any]) 
end, 
multi server(). 


这 上段 代码 模拟 了 许多 常见 服务 的 关键 行为 。 
口 在 第 8~11 行 里 ， 它 表现 出 电子 邮件 客户 端的 行为 。 
电子 邮件 客户 端的 关键 任务 是 接收 邮件 并 把 它 保存 到 你 的 计算 机 里 〈 按 惯例 是 一 个 名 为 
mbox 的 文件 )。 我 们 接收 一 个 消息 ,打开 名 为 mbox 的 文件 ， 把 消息 写 入 这 个 文件 ,任务 完 
成 。 
口 在 第 12~13 行 里 ， 它 表现 出 即时 通讯 客户 端的 行为 。 
即时 通讯 客户 端的 关键 任务 是 接收 一 个 消息 并 告知 用 户 。 通 过 回 探 制 台 写 人 消息 来 告知 
用 户 。 
口 在 第 14~15 行 里 ， 它 表现 出 FTP/RCP/HTTP 服 务 器 的 行为 。 
FTP 服 务 硕 、HTTP 服 务 融 或 其 他 任何 文件 服务 套 的 关键 任务 是 把 一 个 文件 从 服务 大 传送 
到 客户 端 。 
看 了 这 上 段 代码 ,我 们 意识 到 其 实 并 不 需要 那么 多 各 不 相同 的 客户 病 - 服 务 问 请 求 和 啊 应 编码 ， 
有 一 种 通用 的 格式 就 足够 了 了。 一 切 消 息 都 使 用 Erlang 数 据 类 型 。 
所 有 这 些 好 东西 都 能 在 分 布 式 环境 里 工作 ， 这 要 归功 于 两 个 内 置 函数 : term_to_binary 
(Term) 和 逆 卫 数 binary_to_term(Bin)， 后 者 用 于 恢复 数据 类 型 。 
在 分 布 式 系统 里 , binary_to_term(Bin) 可 以 根据 Bin 里 保存 的 数据 类 型 外 部 表现 形式 来 重 
建 任何 数据 类 型 。 Bin 一 般 通 过 套 接 字 进入 机 姨 , 不 过 具体 的 细 市 在 此 并 不 重要 。binary to term 
只 是 简单 地 重建 这 个 数据 类 型 ， 而 在 像 HTTP 这 样 的 协议 里 ， 输 入 的 请 求 必须 进行 解析 ， 这 就 导 
致 了 整个 过 程 效 率 低 下 。 
可 以 添加 一 对 执行 规定 任务 的 对 称 子 数 来 实现 加 密 层 和 压缩 层 。 这 里 有 一 个 例子 : 


sendl(Term) -> encrypt(compress(term to binary (Term))). 




















receivel(Bin) -> binary to term(decompress(decrypt(Bin))). 
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如 果 想 要 通过 网 络 发 送 加 密 并 压缩 过 的 移动 代码 ”"， 就 可 以 这 么 写 : 
send code(Mod, Func, Args) -> 


encrypt (compress (term to binary({Mod,Func,Args}))). 


receive code(Bin) -> 
{Mod, Func, Args} = binary to term(decompress(decrypt (Bin))), 
apply(Mod, Func, Args). 

在 这 里 组 合 了 三 个 概念 : 用 term to binary 和 它 的 逆 函 数 通 过 网 络 发 送 数 据 类 型 , 用 apply 
执行 代码 ， 以 及 用 对 称 函 数组 来 压缩 /解压 缩 和 加 密 /解密 数据 。 请 注意 ， 这 些 压缩 /解压 缩 和 加 密 
/解密 也 数 不 是 Erlang 的 内 置 函 数 ， 我 们 只 是 假设 存在 这 样 的 函数 。 

对 Erlang 程 序 员 而 言 ， 这 个 世界 很 美好 。 编 写 了 恰当 的 中 间 人 进程 之 后 ， 所 有 外 部 进程 就 都 
会 婉 Erlang 语 言 了 。 这 让 复杂 系统 真正 得 到 简化 ， 特 别 是 在 使 用 多 种 不 同 外 部 协议 的 情况 下 。 

这 就 像 是 一 个 人 人 都 说 英语 〈 或 普通 话 ) 的 世界 一 一 交流 变 得 容易 多 了 。 


24.3 ”有 状态 的 模块 


通过 使 用 一 种 被 称 为 元 组 模块 的 机 制 , 可 以 把 状态 和 模块 名 封装 到 一 起 。 可 以 用 这 种 机 制 来 
隐藏 信息 和 创建 适配器 模块 , 后 者 会 对 使 用 接口 的 程序 隐藏 接口 细节 。 如 果 想 制作 面向 多 个 不 同 
模块 的 接口 ， 或 者 模拟 面向 对 象 编程 的 某 些 特性 ， 这 种 机 制 就 非常 有 用 。 

调用 X:Func(....) 时 ，X 不 必 非 得 是 一 个 原子 ， 它 还 可 以 是 元 组 。 如 果 先 写 X = {Mod，P1， 
P2，...，Pn} 然 后 调用 X:Func(Al, A2，...，An)， 那 么 实际 调用 的 是 Mod:Func(Al, A2,...， 
An ，X) 。 举 个 例子 , {foo,1,2,3}:bar(a,b) 这 个 调用 会 被 转换 成 foo:bar(a,b, {foo,1,2,3})。 

可 以 用 这 种 机 制 来 创建 “有 状态 的 ” 模块。 首先 我 们 将 用 一 个 简单 的 有 状态 计数 需 进 行 演示 ， 
然后 再 转 回 一 个 示例 ， 它 将 为 两 个 现 有 模块 创建 一 个 适 配 硕 模块 。 


有 状态 的 计数 器 


为 了 演示 元 组 模块 这 个 概念 , 我 们 将 从 一 个 简单 的 计数 带 示 例 和 人 手 。 它 和 市 有 一 个 状态 参数 N， 
用 来 表示 计数 带 的 值 。 它 的 代码 如 下 : 



































counter.erl 


-module(counter). 
-expbort( [bump/2, read/1]). 


bump(N, {counter,k}) -> {counter, N + K}. 
read({counter, N}) -> N. 


可 以 像 下 面 这 样 来 测试 这 段 代码 。 首 先 来 编译 模块 。 





中 移动 代码 ( mobile code ) 是 指 在 系统 间 传 输 且 无 需 安装 就 能 执行 的 代码 。 一 一 译 者 注 
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1> cf(counter) ， 
{ok,counter} 


然后 创建 一 个 元 组 模块 的 实例 。 
2> C = {counter,2}. 

{counter, 2} 

然后 调用 get/0。 


3> C:read(). 
2 


因为 C 是 一 个 元 组 ， 所 以 它 会 被 转换 成 counter:read({counter,2})， 这 个 调用 的 返回 值 
是 2 

3> Cl = C:bump(3). 

{counter, 5} 


C:bump (3) 被 转换 成 counter:bump(3，{counter，2})， 因 此 返回 {counter，5}。 


4> Cl:read(). 
5 


值得 注意 的 是 ， 对 元 组 C 和 C1 的 调用 代码 来 说 ,模块 名 counter 和 状态 变量 部 是 隐居 的 。 
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假设 有 两 个 或 多 个 功能 相近 的 库 ,但 无 法 决定 要 用 哪 一 个 .这 些 库 可 能 具有 相似 的 函数 接口 ， 
但 性 能 特征 不 同 。 以 键 - 值 存储 为 例 , 第 一 种 存储 把 键 和 值 放 在 内 存 里 , 第 二 种 把 键 放 在 内 存 里 ， 
把 值 放 在 人 硬盘 上 。 也 许 还 有 第 三 把 值 较 小 的 键 放 在 内 存 里 , 值 较 大 的 则 放 在 人 硬盘 上 。 即 使 
是 键 - 值 存储 这 么 简单 的 事情 ， 也 可 能 存在 多 种 不 同 的 存储 实现 方式 。 
假设 想 编写 一 些 利用 键 - 值 存储 的 代码 。 编 写 这 个 应 用 程序 时 ， 必 须 做 一 个 设计 决策 一 一 从 
这 些 可 用 选项 里 选择 一 种 键 - 值 存 储 。 也 许 过 了 很 人 之后， 某 些 设计 决 全 被 证 明 是 错误 的 ， 那 时 
我 们 也 许 会 想 要 改变 后 并 的 存储 方式 。 但 是 ， 如 采用 来 访问 新 旧 存 储 方式 的 API 不 一 人 改 ， 就 必须 
对 程序 做 大 量 的 修改 。 
这 就 是 适配器 模式 大 显 身 手 的 时 候 了 。 天 配 融 是 一 种 元 组 模块 , 它 能 为 应 用 程序 提供 一 组 统 
一 的 接口 。 
我 们 将 构建 一 个 适 配 副 模式 来 演示 这 一 点 ， 这 个 模式 会 为 用 Lists 和 dict 模 块 实现 的 键 - 值 
存储 提供 统一 的 接口 。 这 个 适 配 硕 的 接口 如 下 。 
口 adapter dbl:new{(Type :: dict | lists) -> Mod 
创建 一 个 Type 类 型 的 新 键 - 值 存储 。 它 会 返回 一 个 元 组 模块 Mod。 
口 Mod:store(Key, Valj -> Modl 
存储 一 个 Key，Value 对 。Mod 是 旧 的 存储 状态 ，Mod1 是 新 的 存储 状态 。 
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口 Mod'Iookup(Key) -> {ok, Veal} | error 
在 存储 里 查找 Key 键 。 如 果 能 找到 值 就 返回 {ok，Val}， 否 则 返回 error。 


可 以 编写 如 下 代码 来 使 用 这 组 API: 


MO = adapter dbl:new(dict), 
M1 = MO':store(Keyl, Val2), 
M2 = Ml:store(Key2, Val2), 


Valk = MK: Lookup (KeyK), 


如 果 想 用 Lists 实 现 ， 就 可 以 把 创建 模块 的 代码 行 改 成 Mod = adapter dbl:new(lists)。 
出 于 兴趣 ， 可 以 把 它 与 用 于 dict 模 块 的 编程 样式 进行 对 比 。 为 dict 编 写 的 代码 如 下 : 


DO = dict:new(), 
D1 = dict:store(Keyl, Vall, D0), 
D2 = dict:store(Key2, Val2, D1), 


Valk = dict:find(KeyK, Dk) 
用 来 访问 元 组 模块 的 代码 要 略 短 一 些 ， 因 为 可 以 把 所 有 内 部 细 世 都 隐藏 在 一 个 Modi 变 量 里 。 


使 用 dict 需 要 两 个 参数 : 变量 4 名 和 字典 结构 本 身 。 
现在 来 编写 适 配 和 需 





adapter db1.erl 


-module(adapter db1) ， 
-export([new/l1, store/3, lookup/2]). 


new(dict) -> 

{?MODULE, dict, dict:new()}; 
New(lists) -> 

{?MODULE, list, []}. 


store(Key, Val, { , dict, D}) -> 
D1 = dict:store(Key, Val, D), 
{?MODULE, dict, D1}; 
store(Key, Val, { , list, LL}) -> 
Ll1 = lists:keystore(Key, 1, L, {Key,Val}), 
{?MODULE, list, Ll}. 


lookup(Key, { ,dict,D}) -> 
dict:find(Key, D); 
lookup(Key, { ,list,L}) -> 
case lists:keysearch(Key, 1, L) of 
{value, {Key,Val}} -> {ok, Val}; 
false -> error 
end. 


这 一 次 我 们 的 模块 是 用 一 个 {adapter _db1l1，Type，Val} 形 式 的 元 组 来 表示 的 。 如 有 果 Type 
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是 List，Val 就 是 一 个 列表 ; 如 果 Type 是 dict，Val 则 是 一 个 字典 。 
可 以 在 一 个 单独 模块 里 编写 一 些 简 单 的 代码 来 测试 这 个 适 配 需 。 











adapter_db1_ test.erl 


-module(adapter dbl test). 
-export([test/0}). 


-Import(adapter dbl, {fnew/1, store/2, lookup/1]). 


test() -> 

测试 dict 模 块 

MO = new(dict) ， 

M1 MO:store(keyl, vall), 

M2 = Ml:store(key2, val2), 
{ok, vall} = M2:Tlookup (key1), 
{ok, val2} = M2:TLookup (key2), 
error = M2:lLookup (nokey), 

#%5 测试 Lists 模 块 


[| 
-66 


NO = new(lists)}), 
Nl1 = NO:store(keyli, vall), 
N2 = Nl:store(key2, val2), 


{ok, vall} = N2:1lookup (key1), 
{ok, val2} = N2:Lookup(key2) ， 
error = N2:lookup (nokey), 

ok. 


1> adapter dbl test:test( ) . 
OK 





测 斌 成功。 这样 就 实现 了 目标 ， 也 就 是 把 两 个 接口 不 同 的 模 匡 陆 藏 在 一 个 适 配 表 模块 之 后 ， 


让 它 提供 对 这 两 个 模块 的 公共 接口 。 
适 配 信 适合 为 已 经 存在 的 代码 提供 通用 接口 
可 以 被 修改 来 反映 出 不 同 的 需求 。 
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, 适 配 带 的 接口 可 以 保持 不 变 , 而 它 痛 后 的 代码 


作为 一 种 编程 风格 ， 表 意 编程 ( intentional programming ) 能 让 我 们 轻易 看 出 程序 员 的 意图 。 





相关 函数 的 名 称 应 当 能 明显 体现 出 程序 员 的 意图 ， 而 不 是 要 通过 分 析 代 码 的 结构 才能 推 新 出 来 。 
一 个 例子 胜 过 千言 万 语 。 在 早期 的 Erlang 里 ， 库 模块 dict 导 出 了 一 个 Lookup/2 困 数 ， 它 的 接口 


如 下 : 


lookup(Key, Dict) -> {ok, Value} | not found 


根据 这 个 定义 ，Llookup 可 以 用 在 三 种 上 下 文 环境 里 。 


(1) 要 检索 数据 ， 可 以 编写 如 下 代码 : 


{ok, Value} = lookup(Key, Dict) 
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此 处 的 Lookup 被 用 来 从 字典 里 提取 带 有 已 知 键 的 项 。 如 果 字 典 里 不 存在 这 个 键 ， 就 会 返回 
not_found， 从 而 导致 模式 匹配 错误 ,程序 会 抛 出 一 个 异常 错误 。 退 出 的 原因 是 {badmatch,， 
not_found} ， 这 个 错误 消息 有 竺 改进， 把 错误 原因 换 成 {bad_key，Key} 的 话 信 息 量 就 会 更 
丰 宇 。 
(2) 要 进行 搜索 ， 可 以 编写 如 下 代码 : 
case lookup(Key, Dict) of 

{ok, Val} -> 

， 对 Val 进 行 操 作 ...， 
not found -> 
， 做 另 一 些 事 ,,， 











印 


end. 

可 以 看 出 程序 员 不 知道 字典 里 是 否 有 这 个 键 ， 因 为 他 们 编写 的 代码 模式 匹配 了 Lookup 的 所 
有 返回 值 ( {ok，Val} 和 not_found )。 我 们 还 能 看 出 程序 对 Val 进 行 了 某 种 操作 ( 根据 注释 )。 
从 这 段 代码 可 以 推断 程序 员 是 想 在 字典 里 搜索 某 个 值 。 当 不 知道 某 个 东西 的 位 置 时 ， 就 会 进行 
搜索 。 

(3) 要 测试 茶 个 键 是 否 存 在 ,下面 的 代码 片段 : 


case lookup(Key, Dict) of 











{ok, } -> 
i 做 一 些 事 55 
not found -> 
:小 男 一 此 可 
end. 








会 测试 字典 里 是 否 存在 特定 的 键 。 得 出 这 个 推论 是 因为 注意 到 Lookup 的 两 种 返回 值 部 有 模 
式 匹 配 ， 但 找到 的 项 目 值 却 从 未 被 使 用 ， 能 看 出 这 一 点 是 因为 模式 匹配 的 是 {ok， } 而 不 是 {ok， 
Val} (就 像 第 一 个 例子 那样 )。 既 然 这 个 键 的 关联 值 未 被 使 用 ,就 可 以 假定 调用 Lookup 是 为 了 测 
试 某 个 键 是 否 存 在 。 

前 面 三 个 例子 让 Lookup 孙 数 出 现 了 含义 超载 。 它 有 三 种 不 同 的 用 途 : 数据 检索 、 搜 索 和 测 
试 某 个 键 是 否 存 在 。 

与 其 猜测 程序 员 的 意图 和 分 析 代 码 , 不 如 调用 一 个 能 显 式 表达 三 种 意图 之 一 的 库 方法 。 dict 
为 此 导出 了 三 个 也 数 。 

dict:fetch(Key, Dict) = Val | EXIT 

dict:search(Key, Dict) {found, Val} | not_ found . 

dict:;is key(Key, Dict) Boolean 

这 些 函 数 能 准确 表达 程序 员 的 意图 。 无 需 猜 测 和 分 析 程 序 , 消 数 名 就 能 清楚 表达 程序 员 的 总 
图 。 如 果 字 典 里 可 能 存在 某 个 键 ， 就 调用 search， 但 不 存在 也 算 不 上 错误 。 如 果 字 典 里 必定 存 
在 菏 个 键 , 就 调用 fetch, 此 时 磊 不 存在 就 算是 错误 。 要 测试 字典 里 是 否 存 在 茶 个 键 则 用 is_key。 

用 Lookup 编 写 的 代码 会 比 用 fetch、search 和 is key 三 者 之 一 编写 的 代码 更 难以 理解 和 
维护 。 
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本 章 最 重要 的 是 中 间 人 这 个 概念 。 力 一 个 极其 重要 的 概念 是 外 部 世界 里 的 一 切 部 应 该 建 模 为 
Erlang 进 程 ， 它 是 让 组 件 无 颖 结合 的 核心 秘诀 。 
在 下 一 半 里 , 我 们 将 了 解 如 何 共 至 代码 以 及 如 何 集 成 目 己 与 他 人 的 工作 成 采 。 为 外 , 还 将 看 
- 些 在 本 书 某 些 示 例 中 用 过 的 第 三 方 工具 。 借用 他 人 的 代码 能 让 我 们 更 快 解决 问题 , 也 可 以 通过 
分 至 目 己 的 代码 来 带 助 他 人 。 如 果 你 帮助 别人 ， 别 人 也 会 帮助 你 。 
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(1) 扩 展 adapter db1 里 的 适配器 , 使 调用 adapter dbl:new(persistent) 能 创建 一 个 持久 
性 数据 存储 的 元 组 模块 。 

(2) 编写 一 种 键 - 值 存储 ,让 它 把 较 小 的 值 放 入 内 存 , 把 较 大 的 值 放 入 和 磁盘。 制作 一 个 适 配 需 
模块 来 实现 它 ， 并 让 这 个 模块 与 本 和 草 前 面 的 适 配 硕 具有 相同 的 接口 。 

(3) 编写 一 种 键 - 值 存储 , 让 它 把 各 个 键 - 值 对 分 为 易 失 性 存储 和 非 易 失 性 存储 。 调 用 put (Key， 
memory，Val ) 会 把 一 个 Key，Val 对 放 入 内 存 ，put (Key，disk，ValL) 则 会 把 数据 存 人 磁盘 。 用 
一 对 进程 来 做 这 件 事 ， 一 个 用 于 易 失 性 存储 ， 男 一 个 用 于 非 易 失 性 存储 。 重 用 本 昔 前 面 的 代码 。 
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本 章 将 讨论 第 三 方程 序 ， 也 就 是 由 用 户 编 写 和 分 发 的 Erlang 程 序 。 这 类 程序 的 首要 来 源 是 
GitHub。 在 这 一 章 里 ,我 们 将 看 到 三 个 来 源 于 GitHub 的 流行 程序 。 还 将 看 到 如 何 创建 和 宣传 一 个 新 
的 GitHub 项 目 , 以 及 如 何 把 某 个 GitHub 项 目 包含 在 日 己 的 应 用 程序 里 ,我 们 将 会 了 解 下 面 这 些 程序 。 

口 rebar: rebar 由 Dave Smith 编 写 ， 它 已 经 成 为 管理 Erlang 项 目的 事实 标准 。 通 过 使 用 rebar， 

用 户 可 以 创建 新 项 目 、 编 译 项 目 、 打 包 它 们 ， 以 及 把 它们 与 其 他 项 目 整合 在 一 起 。rebar 
集成 了 GitHub ， 这 样 用 户 就 能 轻松 获取 其 他 来 目 GitHub 的 rebar 项 目 ， 并 证 目 己 的 应 用 程 
友 整 合 这 些 项 目 。 

口 bitcask: bitcask 由 Basho 公 司 的 人 编写 ， 它 是 一 种 持久 性 的 键 - 值 磁盘 存储 ， 速 度 很 快 ， 

而 且 “ 不 怕 骨 演 ”， 意 思 是 它 能 在 朋 尝 重启 后 快速 恢复 。 
口 cowboy: cowboy 由 Loic Hoguin 编 写 ， 它 是 一 个 用 Erlang 编 写 的 高 性 能 Web 服 务 角 , 正在 成 
为 般 入 式 Web 服 务 硕 的 热门 实现 方式 。 我 们 曾 把 cowboy 服 务 硕 用 于 第 18 草 里 的 代码 。 


25.1 ”制作 可 共 圣 代码 存档 并 用 rebar 管理 代码 


在 这 一 市 里 ,我 们 将 一 步 步 制 作 一 个 开源 Erlang 项 目 ， 并 把 它 托管 在 GitHub 上 。 我 会 假定 你 
已 经 有 一 个 GitHub 账 喜 。 我 们 将 用 rebar 来 管理 这 个 项 目 。 

我 们 会 做 下 面 这 些 事 。 

(1) 安 竣 rebar。 

(2) 在 GitHub 上 创建 一 个 新 项 目 。 

(3) 在 本 地 克隆 这 个 项 目 。 

(4) 用 rebar 添 加 项 目 样 板 代 人 三 。 

(5) 用 rebar 编 译 我 们 的 项 目 。 

(6) 将 我 们 的 项 目 上 传 到 GitHub。 












































25.1.1 安装 rebar 


rebar 可 以 在 https://github.com/basho/rebar 里 找到 。 你 应 该 能 在 https://github.conmy/rebar/rebar/ 
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wiki/rebar 找 到 rebar 的 预 编 译 二 进 制 文件 。 要 安装 rebar， 请 复制 该 文件 ， 修 改 文件 模式 为 可 执行 ， 
然后 把 它 放 在 路 径 里 的 某 个 地 方 。 

做 完 这 些 之 后 ， 应 当 测 试 一 下 是 否 能 运行 rebar。 

$ rebar -VY 

rebar 2.0.0 R14B04 20120604 145614 git 0f24d93 








25.1.2 ”在 GitHub 上 创建 一 个 新 项 目 


假设 要 制作 一 个 名 为 bertie 的 新 项 目 (我 经 常用 Alexander McCall Smith 书 里 的 人 物 命 名 我 的 
项 目 )。 第 一 步 是 创建 一 个 新 的 GitHub 项 目 ， 为 此 我 登录 GitHub 账 户 并 按照 说 明 来 创建 一 个 新 的 
储存 库 ( repository )。 

(1) 点 击 登 录 页 工具 条 右上 方 的 “Create a new repo”( 创建 一 个 新 储存 库 ) 图 标 ， 它 看 上 去 
就 像 一 本 向 有 加 号 的 书 。 

(2) 把 它 设置 成 市 目 述 文件 的 公开 储存 库 。 

(3) 然后 点 击 “Create Repository”( 创建 存储 库 )。 


25.1.3 ”在 本 地 克隆 这 个 项 目 


我 家 中 的 机 器 里 有 一 个 名 为 ${HOME}/published 的 目录 ， 我 用 它 存放 所 有 的 共享 项 目 。 我 
移 至 这 个 pubLished 目 录 ， 然 后 克隆 GitHub 储 存 库 。 


$ cd ~/pubLished 

$ git cLone gilitGglithub,com:joearms/bertie ,glLt 

Cloning into 'bertie’'.,.. 

Identity added: /Users/joe/.ssh/id rsa (/Users/joe/.ssh/id rsa) 
remote: Counting objects: 3, done. 

remote: Compressing objects: 100% {2/2)}, done. 

remote: Total 3 (delta 0), reused 0 (delta 0) 

Receiving objects: 100% {3/3), done. 


现在 我 通 弟 会 检查 一 下 是 否 能 把 改动 写 入 储存 库 。 因 此 ， 我 修改 了 日 述 文件 并 把 它 推 回 储 
存 库 。 


$ emacs -nw README.md 

$ git add README .md 

$ git commit README .md 

$ git push 

Counting objects: 5，done， 

Delta compression Using up to 2 threads. 
Compressing objects: 100% (2/2), done., 
Writing objects: 1l00% (3/3), 326 bytes, done. 
Total 3 (delta 0), reused 0 (delta 09) 

To git@github.com:joearms/bertie.git 
6b9b6b9. .6b0148e master -> master 
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看 到 这 个 结果 ， 我 松 了 一 口气 ,不禁 赞叹 现代 科技 的 神奇 。 
现在 我 有 了 一 个 本 地 目录 ~/published/bertie， 它 与 GitHub 储 存 库 git@github.com: 
joearms/bertie.git 是 同步 的 。 


25.1.4 ”制作 一 个 OTP 应 用 程序 
现在 移 至 bertie 目 录 ， 然 后 用 rebar 创 建 一 个 标准 OTP 应 用 程序 。 


$ cd ~/published/bertie 

$ rebar create-app appid=bertie 
==> bertie (create-app) 

Writing src/bertie.app,src 
Writing src/bertie app.erl 
Writing src/bertie sup.erl 


rebar create-app 命 令 创 建 了 标准 OTP 应 用 程序 所 需 的 样板 文件 和 目录 结构 。 
现在 给 ~/published/bertie/src 目 录 添 加 一 个 bertie.erl 模 块 。 





-module (bertie). 
-export( [start/0]). 


start() -> io:format("Hello my name 1s Bertie~n"). 
然后 用 rebar 来 编译 这 一 切 。 


> rebar compile 

==> bertie (compile) 
Compiled src/bertie.erl 
Compiled src/bertie app.erl 
Compiled src/bertie sup.erl 


现在 我 们 就 得 到 了 一 个 完整 的 程序 ， 剩 下 的 事 就 是 把 它 推 回 储存 库 。 


$ git add src 
$ git commit 
$ git push 





25.1.5 宣传 你 的 项 目 


现在 你 已 经 编写 代码 并 把 它 发 布 到 GitHub 上 了 , 下 一 步 就 是 宣传 它 。 最 显而易见 的 方式 就 是 
在 Erlang 邮 件 列 表 "” 上 发 一 条 简短 的 通告 ， 或 者 发 一 条 带 #erLang 标 签 的 推 特 。 

如 果 有 用 户 想 要 使 用 你 的 应 用 程序 , 他 们 要 做 的 就 是 下 载 它 并 运行 rebar compile 来 构建 这 
个 应 用 程序 。 
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25.2 ”整合 外 部 程序 与 我 们 的 代码 


我 们 已 经 演示 了 在 GitHub 上 发 布 你 的 劳动 成 果 所 需 的 步 嗓 , 接 下 来 看 看 如 何 让 我 们 的 项 目 包 
含 他 人 的 劳动 成 果 。 下 面 这 个 例子 将 把 来 自 bitcask 的 代码 整合 到 bertie 项 目 中 。 

修改 bertie， 让 它 在 启动 时 打印 出 已 启动 次 数 。 例 如 ， 当 bertie 第 10 次 启动 时 ， 让 它 进行 如 下 
通报 : 








Bertie has been run 10 times 


为 了 做 到 这 一 点 ， 我 们 将 把 bertie 的 已 运行 次 数 保存 在 一 个 bitcask 数 据 库 里 。 在 bitcask 
里 ， 键 和 值 都 必须 是 二 进 制 型 。 选 择 二 进 制 型 <<"n">> 作 为 键 ，term to binary(N) 作 为 值 ， 其 
中 N 是 bertie 的 已 运行 次 数 。 现 在 bertie.erL 的 代码 如 下 : 





bertie/bertie.erl 


-module (bertie)}). 
-export([start/0]). 


start() -> 
Handle = bitcask:open("bertie database'", [read write])， 
N = fetch(Handle), 
store(Handle, N+1), 
ijo:format("Bertie has been run ~p times~n",[N]), 
bitcask:close(Handle), 
ijnit:stop(). 


store(Handle, N) -> 
bitcask:put(Handle, <<"bertie executions">>, term to binary(N) ) ， 
fetch(iHandle) -> 
case bitcask:get(Handle, <<"bertie execut1ions">>) of 
not found -> 1; 
{ok, Bin} -> binary_ to term(Bin) 
end. 


为 了 让 bertie 应 用 程序 包含 bitcask， 将 创建 一 个 名 为 rebar.config 的 “依赖 项 ”文件 ， 然 
后 把 它 保存 在 bertie 项 目的 顶级 目录 里 。rebar.config 的 代码 如 下 : 





bertie/rebar.config 
{deps, [ 

{bitcask, ".*", {git, "git://github.com/basho/bitcask.git", "master"}} 
| 


我 还 添加 了 一 个 makefile。 


bertie/Makefile 


all: 
test -d deps || rebar get-deps 


rebar compile 
GerL -noshell -pa './deps/bitcask/ebin' -pa './ebin' -s bertie start 
当 第 一 次 运行 这 个 makefile 时 ,会 看 到 以 下 输出 : 


$ ejoearmaejoearm-eld:~/published/bertie$ make 

==> bertie (get-deps) 

Pulling bitcask from {9it,"git://github.com/basho/bitcask.git","master"} 
Cloning into 'bitcask'... 

==> bitcask (get-deps) 

Pulling meck from {9it,"git://github,.com/eproxus/meck"} 

Cloning into 'meck’'... 

==> meck (get-deps) 

rebar compile 

==> meck (compile) 


Bertie has been run 1 times 


rebar get-deps 命 令 从 GitHub 获 取 bitcask 并 把 它 保存 在 名 为 deps 的 子 目 录 里 。bitcask 
目 身 需要 一 个 名 为 meck 的 程序 用 于 测试 , 这 就 是 所 谓 的 递归 依赖 。rebar 会 递归 获取 bitcask 所 需 
的 各 个 依赖 项 ， 并 把 它们 保存 在 deps 子 目录 里 。 

makefile 给 命令 行 添 加 了 一 个 -pa 'deps/bitcask/ebin' 标 识 ， 这 样 当 程序 启动 时 ，bertie 
就 能 自动 载 人 bitcask 的 代码 。 


注意 ”可 以 在 git://github.com/joearms/bertie.git 里 下 载 整 个 示例 。 如 果 已 经 安装 了 
rebar， 你 要 做 的 就 是 下 载 这 个 项 目 并 输入 make。 


25.3 生成 依赖 项 本 地 副本 


我 的 pertie 应 用 程序 在 它 的 本 地 子 目 录 里 生成 了 bitcask 的 本 地 副本 .有 时 候 几 个 不 同 的 应 用 
程序 会 用 到 相同 的 依赖 项 ， 在 这 种 情况 下 ， 我 们 会 在 应 用 程序 的 外 部 创建 一 个 依赖 项 目录 结构 。 

对 于 我 的 本 地 项 目 , 我 会 把 所 有 已 下 载 的 rebar 依 赖 项 保存 在 一 个 地 方 。 我 把 所 有 这 些 依赖 项 
保存 在 一 个 名 为 ~joe/nobackup/erl imports 的 顶级 目录 里 。 我 这 台 机 器 的 组 织 方式 是 
nobackup 目 录 下 的 任何 文件 都 不 会 有 备份 。 因 为 这 些 我 感 兴趣 的 文件 在 Web 上 到 处 都 是 , 所 以 没 
有 必要 创建 本 地 备份 。 

文件 ~joe/nobackup/erlang imports/rebar.config 列 出 了 我 想 要 使 用 的 所 有 依赖 项 ， 
它 的 内 容 如 下 : 

















{deps, [ 
{cowboy, ".*", {git, "git://github,com/extend/cowboy.git", "master"}}, 
{ranch, ".*", {git, "git://github.com/extend/ranch.git", "master"}}, 


{bitcask, ".*", {git, "git://github.com/basho/bitcask.git", "master"}} 
]}. 
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要 获取 这 些 依赖 项 ， 可 以 在 保存 配置 文件 的 日 录 里 输入 命令 rebar get-deps。 


$ rebar get-deps 

==> deps (get-deps) 

Pulling cowboy from {git,"git://github,.com/extend/cowboy.git","master"} 
Initialized empty Git repository in /Users/joe/nobackup/deps/deps/cowboy/ .git/ 
Pulling bitcask from {9git,"git://github.com/basho/bitcask.git","master"} 
Initialized empty Git repository in /Users/joe/nobackup/deps/deps/bitcask/ .git/ 
==> COWboy (get-deps ) 

Pulling proper from {git,"git://github.com/manopapad/proper.git",{tag,"vl.0"}} 
Initialized empty Git repository in /Users/joe/nobackup/deps/deps/proper/ .gity 
==> proper (get-deps) 

==> bijitcask (get-deps) 

Pulling meck from {git,"git://github.com/eproxus/meck"} 

Initialized empty Git repository In /Users/joe/nobackup/deps/deps/meck/ .git/ 
==> Meck (get-deps) 


rebar 不 仅 获 取 了 在 配置 文件 里 指定 的 程序 ， 还 递归 获取 了 这 些 程序 所 依赖 的 其 他 程序 。 
获取 程序 之 后 ， 我 们 用 rebar compitLe 命 令 来 编译 它们 。 


$ rebar compile 
， 多 行 输出 信息 ,，,， 


最 后 一 步 是 把 这 些 依赖 项 的 保存 位 置 告 诉 Erlang， 具体 做 法 是 把 下 面 这 些 代 码 行 移 至 启动 文 
件 ${HOME}/ ,erlang 里 : 


%% 设置 路 径 来 让 所 有 依赖 项 就 位 
Home = 0S:getenv( "HOME ") ， 
Dir = Home ++ "/nobackup/erlang imports/deps", 
{ok, L} = file:list dir(Dir)., 
lists:foreach{fun{(I) -> 

Path = Dir ++ "/" ++ I ++ "/ebin", 

code:add path (Path) 

end, L). 











25.4 用 cowboy 构建 舱 入 式 Web 服务 器 


cowboy 是 一 个 小 型 、 快 速 和 模块 化 的 HITP 服 务 硕 ， 它 是 用 Erlang 编 写 的 ， 可 以 在 
https://github.com/extend/cowboy 里 找到 。 它 得 到 了 Nine Nines 公司 的 支持 。 

cowboy 适 合 构 建 通 入 式 应 用 程序 。 它 没有 配置 文件 ， 也 不 会 生成 日 志 。 一切 都 是 由 Erlang 
控制 的 。 

制作 一 个 非常 简单 的 Web 服 务 器 ， 它 由 命令 simple web server:start(Port) 启 动 。 启 动 
后 的 服务 硕 会 监听 Port 上 的 命令 ， 它 的 根 目 录 则 是 程序 启动 时 的 目录 。 

负责 局 动 一 切 的 主 困 数 如 下 : 
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cowboy/simple_web_server.erl 
Line1 start(Port) -> 
- ok = application:start(crypto), 
ok = application:start(ranch), 
ok = application:start(cowboy), 
5 N acceptors = 10, 
Dispatch = cowboy router:compilel( 
[ 
%% {URIHost, List({URIPath, Handler, Opts})} 
{' ', [{'_', Simple web server, []}]} 
10 ] )， 
cowboy:start http(my_simple web server., 
N_acceptors, 
[{port, Port}], 
[{env, [{dispatch, Dispatch}]}] 
15 下 
第 2~4 行 局 动 OTP 应 用 程序 。 第 5 行 把 Web 服 务 融 的 “接收 策 ” 数 量 设 为 10， 意 思 是 Web 服 务 
从 用 10 个 并 行进 程 来 接受 HTTP 连 接 请 求 。 同 时 进行 的 并 行 会 话 数 可 能 会 远 超 这 个 数字 。 
Dispatch 变 量 包含 一 个 “调度 器 异 式 ”列表 ,调度 器 模式 会 把 URI 路 径 映 射 到 将 要 处 理 这 个 请 求 
的 模块 名 上 。 第 9 行 的 模式 把 所 有 请 求 都 映 冉 到 了 simple_web_server 模 块 上 。 
cowboy router:compile(Display) 通 过 编译 调度 器 信息 来 创建 更 高 效 的 调度 器 ， 
cowboy:start http/4 则 会 启动 Web 服 务 器 。 
调度 天 模式 给 出 的 模块 必须 提供 三 个 回调 方法 : init/3、handle/3 和 terminate/2。 这 个 
案例 里 只 有 一 个 名 为 simptLe _ web _ server 的 处 理 模块 。 首 先 来 看 init/3， 它 会 在 Web 服 务 需 收 
到 新 连接 时 被 调用 。 





cowboy/simple_web server.erl 

init({tcp, http}, Req, _Opts) -> 
{ok, Req, undefined}. 

对 init 的 调用 包含 三 个 参数 。 第 一 个 说 明了 服务 器 收 到 的 连接 类 型 ， 在 这 个 案例 里 是 HTTP 
连接 。 第 二 个 参数 在 cowboy 里 被 称 为 请 求 对 象 ， 它 包含 了 关于 请 求 的 信息 , 并 将 最 终 包 含 要 发 回 
浏览 三 的 信息 。cowboy 提 供 了 众多 函数 来 从 请 求 对 象 里 提取 信息 , 以 及 在 请 求 对 象 里 保存 将 被 发 
回 浏览 器 的 信息 。init 的 第 三 个 参数 ( 0pt ) 是 调用 cowboy router:compile/1 时 在 调度 元 组 
里 给 出 的 第 三 个 参数 。 

init/3 按 惯例 会 返回 元 组 {fok，Req，State}+， 使 Web 服 务 需 接受 这 个 连接 。Req 是 请 求 对 
象 ，State 是 一 个 与 连接 相关 的 私有 状态 。 如 末 连 接 被 接受，HTTP 驶 动 怠 会 调用 handLe/2 顶 数 
并 附 上 init 函 数 返 回 的 请 求 对 象 和 状态 。handtLe/2 的 代码 如 下 : 














cowboy/simple_web_server.erl 


Line1 handle(Req, State) -> 
2 {Path, Reql} = cowboy_req:path (Req), 
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3 Response = read file(Path), 
4 {ok, Req2} = cowboy_ req:reply(200, [], Response, Req1), 
5 {ok, Req2, State}. 








handle 调 用 cowboy_req:path (Req) (第 2 行 ) 来 提取 被 请 求 资 源 的 路 径 。 举 个 例子 ， 如 果 
用 户 请 求 来 自 http://LocaLhost:1234/this page.html 这 个 地 址 的 网 页 ，cowboy req: 
path (Req) 就 会 返回 路 径 <<"/this page.html">>。 路 径 由 一 个 Erlang 二 进 制 型 表示 。 

文件 读 取 的 结果 ( Response ) 通 过 cowboy req:reply/4 打 包 到 请 求 对 象 里 , 成 为 handle/2 
返回 值 的 一 部 分 ( 第 4~5 行 )。 

读 取 被 请 求 网 页 是 由 read file/1 完 成 的 。 











cowboy/simple_web_server.erl 
read file({Path) -> 
File = ["."|binary to list(Path)], 
case fitle':read flitetFite) of 
{ok, Bin} -> Bin; 
_ -> ["<pre>cannot read:", File, "</pre>"] 
end. 


因为 假定 所 有 输出 的 文件 都 来 目 Web 服 务 硕 的 局 动 目录 , 所 以 为 文件 名 加 了 一 个 点 作为 前 级 
(否则 会 以 一 个 笠 杠 开头 )， 这 样 就 能 正确 读 取 文件 了 。 

基本 上 就 是 这 样 , 下 面 发 生 的 事 将 由 套 接 字 的 建立 方式 决定 。 如 果 是 一 个 长 连接 ( keep-alive 
connection )，handle 就 会 被 再 次 调用 ; 如果 连接 被 关闭 ， 就 会 调用 terminate/3。 








cowboy/simple_web_server.erl 


terminate( Reason, Req, State) -> 
Ook. 


了 解 如 何 制 作 简 单 的 服务 善之 后 ， 我 们 将 运用 有 关 的 基本 结构 来 制作 一 个 更 有 用 的 示例 。 

编写 一 个 JSON 人 往返 程序 , 让 数据 从 浏览 器 到 Erlang 再 返回 。 这 个 示例 的 意义 在 于 它 能 展示 如 
何 建 立 浏 览 锅 和 Erlang 的 接口 。 从 浏览 硕 里 的 一 个 JavaScript 对 象 人 手 ， 把 它 编码 为 JSON 消 息 并 
发 给 Erlang， 然后 在 Erlang 里 解码 这 个 消息 ,将 它 变 成 Erlang 数 据 结 构 ， 最 后 再 发 回 浏览 右 并 将 它 
还 原 成 一 个 JavaScript 对 象 。 如 果 一 切 顺 利 ， 这 个 对 和 象 就 能 顺利 往返 并 保持 原状 。 

先 从 Erlang 代 码 开 妈 ， 让 它 比 之 前 例子 里 的 更 通用 一 些 。 添 加 一 个 元 调用 功能 ， 这 样 就 能 从 
浏 贤 妖 里 调用 任意 Erlang 哨 数 了 。 当 浏 贤 妖 请 求 URI 形 式 为 http://Host/cgi?mod 
=Modname&Func=Funcname 的 网 页 时 ， 我 们 想 让 Erlang Web 浏 览 妖 调用 函数 Mod:Func(Args)， 
其 中 Args 是 JSON 数 据 结 构 。 

实现 这 种 做 法 的 代码 如 下 : 





























cowboy/cgi web server.erl 
handle(Req, State) -> 


{Path, Reql} = cowboy req:path (Req), 
handlel(Path, Reql, State). 





362 第 25 章 第 三 方程 序 


handlel(<<"/cgi">>, Req, State) -> 
{Args, Reql} = cowboy req:qs vals (Req), 
{ok, Bin, Req2} = cowboy_ req:body (Req1), 
Val = mochijson2:decode (Bin), 
Response = call(Args, Val), 
Json = mochijson2:encode (Response), 
{ok, Req3} = cowboy req:reply(200, [], Json, Req2), 
{ok, Regq3, State}; 
handlel(Path, Req, State) -> 
Response = read file(Path), 
{ok, Reql} = cowboy req:reply(200, [], Response, Req), 
{ok, Reql, State}. 


它 与 本 章 前 面 展示 的 代码 很 相似 ， 只 有 少许 区 别 : 调用 cowboy_req:qs 来 分 解 查询 字符 串 ， 
调用 cowboy_req:body 来 提取 HTTP 请 求 的 主体 。 还 调用 了 来 自 mochiweb2 库 (位 于 https://github. 
com/mochi/mochiweb/ ) 的 编码 与 解码 方法 来 实现 JSON 字 符 串 和 Erlang 数 据 类 型 的 相互 转换 。 人 处 
理 调 用 的 代码 如 下 : 











cOwboy/cgi_web _server.er| 


CaLlLL([I{<< "hoc >>， MB {<<"func">>,FB}], X) -> 
Mod = List to atom(binary to _ List(MB) ) ， 
Func = list to atom(binary to List(FB) )， 
apply (Mod, Func, [Xx]). 


这 里 是 echo (回声 ) 代码 : 


cowboy/echo.erl 


-module (echo), 
-export( [me/1])., 


me(X) -> 
io:format("echo:~p~n",[X]), 
X, 


我 们 已 经 写 完了 了 Erlang 代码 ， 现 在 轮 到 浏览 大 里 的 对 应 代码 了 。 它 只 需要 几 行 JavaScript 和 
jQuery 库 调 用 。 








cowboy/test2.html 


<SCrlLpt src="//ajax.googtleapis.com/ajax/tlibs/Jjquery/1.9.1/7query.min.]]s"></script> 
<hl>Test2</h1> 
<button id="buttonl">click</button> 
<div id="result"></div> 
<script> 
$(document) .ready (go0); 
var data = {int:1234, 
string:"abcd", 
array:[1,2,3,.'abc’'], 
map: {one:'abc', two:l1l, three:"abc"}}; 
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function go()t 
$("#buttonl").click(test),; 
} 
function test()t{ 
$.ajax({url:"cgi?mod=echo&func=me", 
type:'POST', 
data:JSON.stringify (data), 
suCccess:function(str})t{ 
var ret = JSON.parse(str); 
$("#result") .html ("<pre>"+ 
JSON.stringify(ret, undefined, 4) + 
"</pre>" );， 
}7)3 
} 


</script> 
现在 在 1234 端 口上 局 动 Web 服 务 硕 ， 这 个 操作 可 以 在 shell 里 进行 。 


1> cg1i web server:start(1234). 
{okKk,...} 


服务 磊 启 动 之 后 ， 可 以 在 浏览 侣 里 输入 地 址 http://localhost:1234/test2.html， 这 样 就 能 看 见 市 
有 一 个 按钮 的 网 页 。 点 击 按钮 时 会 执行 测试 ， 浏 览 套 会 显示 出 从 Erlang 发 回 的 数据 ( 图 25-1 )。 





SO0Of J localhost:1234/test2.html| x 





-一 (aa 会 | [Ilocalhost:1234/test2.html 


Test2 


Click 


"int": 1234, 
"string": "abcd", 
"arravy": | 


图 25-1 Erlang 发 回 的 JSON 数 据 类 型 
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在 Erlang shell 的 窗口 里 能 看 到 下 面 这 些 输出 : 


> echo:{struct, [{<<"int">>,1234}, 
{<<"string">>,<<'"abcd">>}, 
{<<"array">>, {1,2,3,<<"abc">>]}, 
{<<"Mmap ">>, 
{struct, [{<<"onNe">>, <<"abc'">>}, 
{<<" two">>, 1}, 
{<<"three">>,<<"abc">>}]}}]} 


这 是 mochijson2:decode/1 返 回 的 Erlang 解 析 树 。 如 你 所 见 , 数据 能 在 两 个 系统 之 间 正 确 传 输 。 


注意 不 是 所 有 JSON 数 据 类 型 都 能 顺利 往返 于 浏览 器 和 Erlang 之 间 。JavaScript 的 整数 精度 有 限 ， 


而 Erlang 有 大 数字 ( bignum )， 所 以 在 处 理 大 整数 时 可 能 会 遇 到 麻烦 。 类 似 地 ， 浮 点 数 可 


能 在 转换 过 程 中 损失 精度 。 


恕 


除了 从 Erlang shell 里 启动 Web 服 务 器 ， 我 们 还 可 能 会 想 从 makefile 或 命令 行 里 启动 服务 右 。 
在 这 种 情况 下 ， 需 要 添加 一 个 方法 来 把 Erlang 从 shell 里 接收 到 的 参数 (一 个 原子 列表 ) 转换 成 局 


动 服 务 侣 所 知 的 格式 。 








cowboy/cgi web_ server.erl 


start from shell([PortAsAtom]) -> 
PortAsInt = list to integer(atom to list(PortAsAtom)), 


start(PortAsInt). 

举 个 例子 ， 要 启动 一 个 监听 5$000 端 口 的 服务 器 ， 我 们 会 给 出 以 下 命令 : 

$ erl -s cgi web server start _ from shell 5000 

这 一 章 展 示 了 如 何 用 rebar 实 现 简 单 的 项 目 管理 。 展示 了 如 何在 GitHub 创 建 一 个 新 项 目 , 如 何 
用 rebar 管 理 它 ， 如 何 包含 来 自 GitHub 的 项 目 ， 以 及 如 何 把 它们 包含 在 自己 的 项 目 里 。 我 们 用 一 个 
简单 的 例子 展示 了 如 何 用 cowboy 构 建 一 个 专门 的 Web 服 务 硕 。 在 第 18 章 里 构建 的 Web 服 务 器 和 本 
董 展示 的 代码 非 党 相似。 

第 二 个 cowboy 示 例 用 来 自 mochiweb 的 编码 和 人 解码 方法 把 JSON 数 据 类 型 转换 成 Erlang 结 构 。 
当 Erlang 的 R17 版 引入 映射 组 后 ， 我 将 修改 本 书 里 的 代码 来 反映 这 一 变化 。 

在 下 一 草 里 , 我 们 将 来 了 解 多 核 计算 机 , 同时 探索 一 些 并 行 化 技巧 来 让 代码 运行 在 多 核 计 算 
机 上 。 当 在 多 核 CPU 上 运行 时 ,并 发 程序 会 变 成 并 行程 序 ， 所 以 运行 速度 应 当 会 更 快 一 一 看 看 是 





























25.5 ”练习 


(1) 注册 一 个 GitHub 账 号 ， 然 后 按照 本 章 开 头 的 步 又 来 创建 你 自己 的 项 目 。 
(2) 第 二 个 cowboy 示 例 可 能 是 不 安全 的 。 用 户 可 以 通过 CGI 调用 接口 请 求 执行 任意 的 Erlang 
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檬 块 。 重 新 设计 这 个 接口 ， 让 它 只 允许 调用 一 组 事先 定义 的 模块 。 

(3) 对 cowboy 示 例 做 一 次 安全 审计 ， 因 为 它 的 代码 里 有 许多 安全 问题 。 例 如 被 请 求 文件 的 值 
未 经 检查 ， 这 样 用 户 就 能 访问 Web 服 务 需 目录 结构 以 外 的 文件 。 找 到 并 修复 这 些 安全 问题 。 

(4) 任何 主机 都 能 连接 到 cowboy 服 务 硕 。 修 改 它 的 代码 ， 让 它 只 人 允许 来 目 己 知 卫 地 址 的 主机 
连接 。 把 这 些 主机 保存 到 某 种 持久 性 数据 库 里 ， 比 如 Mnesia 或 bitcask。 记 录 某 个 特定 主机 进行 了 
多 少 次 连接 。 制 作 一 个 主机 墨 名 单 ， 登 记 那 些 在 给 定时 间 段 内 连接 过 于 频 索 的 主机 。 

(5) 修改 Web 服 务 器 ,让 它 人 允许 对 通过 CGI 接口 调用 的 模块 进行 动态 重 编译 。 在 我 们 的 示例 里 ， 
echo .erL 模 块 必 须 先 编译 才能 调用 。 当 某 个 模块 通过 CGI 接口 被 调用 时 ， 谈 取 其 beam 文 件 的 时 
间 惟 并 与 对 应 ,erL 的 时 间 惟 进行 比较 ， 如 有 必要 就 重新 编译 和 载 人 Erlang 代 码 。 

(6) rebar 是 把 Erlang 程 序 作 为 “独立 ”二 进 制 文件 分 发 的 优秀 范例 。 请 把 rebar 的 可 执行 文件 
复制 到 一 个 空白 目录 并 重 命名 为 rebar.zip (rebar 其 实 是 一 个 zip 文 件 )， 人 然后 解压 缩 并 检查 里 面 
的 内 容 。 用 cowboy 示 例 代 码 制作 你 目 己 的 目 执 行 二 进 制 文件 。 
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如 何 编写 能 在 多 核 CPU 上 跑 得 更 快 的 程序 ? 答案 尽 在 可 变 状 态 和 并 发 里 。 

在 过 去 〈 大 约 20 年 之 前 )， 并 发 有 两 种 模式 : 

口 共享 状态 式 并 发 ; 

口 消息 传递 式 并 发 。 

编程 界 选择 了 一 个 方向 ( 通 往 共 享 状 态 )，Erlang 社 区 则 选择 了 另 一 个 方向 。( 还 有 零星 几 种 
编程 语言 选择 了 “消息 传递 式 并 发 ”这 条 路 ， 比 如 Oz 和 Occam。 ) 

消息 传递 式 并 发 里 不 存在 共有 状态 , 所 有 计算 都 是 在 各 个 进程 里 完成 的 , 异步 消息 传递 是 唯 
一 的 数据 交换 方式 。 

为 什么 这 是 件 好 事 ? 

共 至 状态 式 并 发 涉及 “可 变 状态 ”( 可 修改 的 内 存 ) 这 个 概念 ， 所 有 语言 《比如 C、Java 和 
C++ ) 都 有 一 种 叫 状 态 的 东西 ， 而 且 我 们 可 以 改变 它 。 

如 有 果 只 有 一 个 进程 能 改变 它 ， 倒 也 没什么 问题 。 

但 如 果 你 有 多 个 进程 共享 和 修改 同一 处 内 存 区 域 ， 就 有 大 麻烦 了， 会 发 生 许多 疯狂 的 事 。 

为 了 防止 同时 修改 共享 内 存 ,， 我 们 会 使 用 一 种 锁定 机 制 。 你 可 以 叫 它 互 斥 (mutex )、 同 步 方 
法 〈synchronized method ) 或 其 他 什么 名 字 ， 但 它 归 根 到 的 就 是 一 种 锁 。 

如 采 程 序 在 临界 区 月 淡 了 ( 当 它 们 持 有 锁 时 )， 灾 难 就 会 发 生 ， 其 他 所 有 程序 都 不 知道 该 怎 
么 办 。 如 来 程 序 损坏 了 共享 状态 的 内 存 ， 也 会 发 生 灾 难 ， 其 他 程序 同样 不 知道 该 怎么 办 。 

程序 员 该 如 何 修复 这 些 问题 ? 疏 介 会 大 费 周折 。 他们 的 程序 也 许 在 单 核 处 理 带 上 能 用 , 但 对 
多 核 处 理 关 来 说 ， 这 人 向 百 是 灾难 。 

这 类 问题 有 多 种 解决 方案 (事务 内 存 很 可 能 是 首选 )， 但 它们 在 最 好 的 情况 下 也 不 过 是 揭 强 
解决 问题 ， 在 最 坏 的 情况 下 则 会 是 梦 厦 。 

Erlang 没 有 可 变 的 数据 结构 (这 人 句 话 不 是 百 分 百 正确 ， 但 算是 基本 正确 )。 

口 没有 可 变 的 数据 结构 = 没有 锁 。 

口 没有 可 变 的 数据 结构 = 能 够 轻松 并 行 。 

如 何 实现 并 行 计 算 ? 很 测 单 。 程 序 员 把 问题 的 解决 方案 分 配 到 奉 干 个 并 行进 程 里 。 

这 种 编程 风格 有 它 目 己 的 专业 术语 : 面向 并 发 编程 。 
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26.1 给 Erlang 程序 员 的 好 消息 


这 里 有 个 好 消息 : 你 的 Erlang 程 序 也 许 能 在 n 核 处 理 磊 里 快 上 n 倍 ， 而 且 无 需 修改 程序 。 

但 是 必须 避 循 一 僚 人 简单 的 规则 。 

如 果 想 让 应 用 程序 在 多 核 CPU 里 运行 得 更 快 , 就 必须 确保 它 拥 有 大 量 互 不 冲突 的 进程 , 而 且 
程序 里 没有 顺序 瓶颈 。 

如 采编 瑟 的 是 一 整 块 顺序 代码 ， 并 且 没 有 使 用 spawn 来 创建 哪怕 一 个 并 行进 程 ， 程序 也 许 就 
不 会 变 得 更 快 。 

不 要 丧气 。 即 使 你 的 程序 一 开始 是 一 个 巨大 的 顺序 程序 , 对 它 做 一 些 简单 的 修改 也 能 使 它 并 
行 化 。 

在 本 草 ， 我 们 将 看 到 以 下 主题 : 

口 如 何 让 程序 高 效 运行 在 多 核 CPU 上 ; 

口 如 何 让 顺序 程序 并 行 化 ; 

口 顺序 瓶颈 的 问题 ; 

口 如 何 避 免 副 作用 。 

介绍 完 这 些 之 后 , 我 们 将 来 看 一 个 更 复杂 的 设计 问题 。 我 们 将 实现 一 个 名 为 mapreduce 的 高 
并 展示 如 何 用 它 来 使 计算 并 行 化 。mapreduce 是 由 谷歌 公司 开发 的 一 种 抽象 ， 用 来 在 多 
组 计算 单元 上 执行 并 行 计算 。 


26.2 ”如 何在 多 核 CPU 上 使 程序 高 效 运行 


要 实现 高 效 运 行 ， 必 须 做 下 面 这 些 事 : 

口 使 用 大 量 进程 ; 

口 避免 副作用 ; 

口 避免 顺序 瓶颈 ; 

口 编写 “小 消息 ， 大 计算 ”的 代码 。 

如 果 都 做 到 了 ， 我 们 的 Erlang 程 序 就 应 当 能 高 效 运行 在 多 核 CPU 上 。 


















































为 什么 要 重视 多 核 CPU 

你 可 能 会 疑惑 这 么 大 费 周章 是 为 什么 。 难 道 非 得 为 了 多 核 运行 而 让 程序 并 行 化 吗 ? 答案 
是 肯定 的 。 如 今 ， 带 有 超 线程 的 四 核 CPU 十 分 常见 , 许多 智能 手机 都 是 四 核 的 。 其 至 我 的 低 配 
置 MacBook Air 都 有 超 线程 的 双核 CPU， 而 我 的 台式 机 是 超 线程 的 八 核 。 

让 程序 在 双核 机 器 里 快 上 两 倍 不 算 太 惊 人 (但 也 有 一 点 点 惊人 ), 不 过 还 是 别 自 其 其 人 了 ， 
双核 处 理 器 的 时 钟 速度 比 单 核 CPU 要 慢 一 些 ， 所 以 性 能 的 提升 也 许 很 有 限 。 

两 们 不 会 让 我 感到 兴奋， 十 倍 却 会 ， 一 百倍 则 会 让 我 非常 、 非 常 兴 奋 。 现 代 处 理 器 的 速 
度 是 如 此 之 快 , 一 个 核心 就 能 运行 4 个 超 线 程 ,， 因此 一 个 32 核 的 CPU 也 许 就 能 市 给 我 们 128 个 线 
程 。 这 就 意味 着 快 上 一 百倍 的 速度 触手 可 及 ， 
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快 上 一 百倍 真 的 会 让 我 很 兴奋 。 
我 们 要 做 的 就 是 编写 代码 。 


26.2.1 使 用 大 量 进程 


这 一 点 很 重要 ， 我 们 必须 让 CPU 保持 忙 保 。 所 有 的 CPU 在 任何 时 候 和 都 应 当 是 忙 委 的。 要 实现 
这 一 点 ， 最 简单 的 方式 就 是 使 用 大 量 进程 。 

当 我 说 大 量 时 ,我 的 意思 是 相对 于 CPU 数 量 的 大 量 。 如 下 有 大 量 的 进程 ,就 不 需要 担心 CPU 
能 人 否 保持 忙 委 了 。 这 看 起 上 去 纯粹 是 一 种 统计 效应 。 如 宁 只 有 少量 进程 , 那么 有 时 候 它 们 可 能 只 
占用 了 其 中 一 个 CPU。 如 果 有 大 量 的 进程 ， 这 种 效应 似乎 就 会 消失 。 如 采 想 让 程序 为 未 来 做 好 准 
备 ， 就 必须 考虑 到 虽然 今天 的 必 搬 里 只 有 少量 CPU ， 但 未 来 的 必 瞩 里 可 能 会 有 几 千 个 CPU。 

这 些 进 程 如 打 有 着 相似 的 工作 量 就 更 好 了 。 把 程序 编写 成 某 个 进程 忙碌 而 其 余 进程 空闲 可 不 
是 个 好 主意 。 

我 们 会 在 许多 应 用 程序 里 “免费 ”得 到 大 量 进 程 。 如 果 应 用 程序 是 “天 生 并 行 ”的 ,就 无 需 
操心 让 代码 并 行 化 了 。 举 个 例子 ， 如 来 正在 编写 一 个 同时 管理 几 万 个 连接 的 消息 传输 系统 ,就 能 
获得 这 几 万 个 连接 的 并 发 ， 而 处 理 单个 连接 的 代码 无 党 操心 并 发 性 。 


26.2.2 ”避免 副作用 


副作用 会 妨碍 并 发 性 。 我 们 在 本 书 的 开头 部 分 融 讨 论 了 “不 会 变 的 变量 "” ， 这 是 理解 Erlang 
程序 为 什么 能 在 多 核 CPU 上 跑 得 比 其 他 程序 用 能 破坏 性 修改 内 存 的 语言 编写 ) 更 快 的 关键 。 

在 融 有 共 圣 内 存 和 线程 的 语言 里 ， 如 末 两 个 线程 同时 写 和 人 公共 内 存 , 灾难 就 可 能 发 生 。 实现 
共有 内 存 式 并 发 的 系统 通过 给 正在 写 和 人 的 共享 内 存 加 锁 来 避免 这 种 事情 发 生 。 这 些 锁 对 程序 员 隐 
藏 , 在 不 同 的 语言 里 表现 为 互 不 或 同步 方法 。 共 至 内 存 的 主要 问题 在 于 一 个 线程 可 以 损坏 为 一 个 
线程 所 使 用 的 内 存 。 因 此 ， 即 使 我 的 程序 是 正确 的 ， 男 一 个 线程 也 可 能 会 弄 乱 我 的 数据 结构 ， 导 
致 程序 骨 淡 。 

Erlang 没 有 共享 内 存 ， 所 以 不 存在 这 个 问题 。 事 实 上 ， 这 人 句 话 并 不 完全 正确 。 只 有 两 种 方式 
能 共享 内 存 ， 所 以 这 个 问题 可 以 轻松 避免 。 这 两 种 共 胖 内存 的 方式 和 共有 式 ETS 或 DETS 表 有 关 。 

不 要 使 用 共享 式 ETS 或 DETS 表 

ETS 表 可 以 被 多 个 进程 共享 。 我 们 在 19.3 市 里 介绍 了 创建 ETS 表 的 几 种 方法 。 通 过 在 ets:new 
里 使 用 某 个 选项 ， 就 能 创建 出 一 个 public 类 型 的 表 。 如 果 你 还 记得 的 话 ， 它 的 效果 如 下 : 

创建 一 个 公共 表 ， 任 何 知道 此 表 标 识 符 的 进程 都 能 读 取 和 写 入 这 个 表 。 

这 么 做 可 能 很 危险 ， 只 有 在 以 下 条 件 得 到 满足 时 才 是 安全 的 : 

口 每 次 只 能 有 一 个 进程 写 入 表 ， 其 他 进程 可 以 读 取 表 ; 

口 写 人 ETS 表 的 进程 是 正确 的 ， 不 会 把 错误 数据 写 人 表 。 

系统 一 般 不 能 满足 这 些 条 件 ， 而 是 要 徘 程 序 欣 辑 。 
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口 注意 1: ETS 表 的 每 一 种 操作 都 是 原子 式 的 ， 但 一 系列 ETS 操 作 无 法 作为 一 个 原子 单元 执 
行 。 虽然 不 会 损坏 ETS 表 里 的 数据 , 但 如 果 多 个 进程 试 网 同时 更 新 一 个 共 胖 表 而 又 没有 协 
调 好 ， 就 可 能 出 现 逻 辑 上 不 一 人 怪 的 表 。 

口 注意 2: ETS 表 类 型 protected 的 安全 性 要 高 得 多 。 只 有 一 个 进程 ( 即 所 有 者 ) 能 写 人 表 ， 
但 可 以 有 多 个 进程 读 取 这 个 表 。 这 一 点 由 系统 保证 。 但 是 请 记 住 ， 即 使 只 有 一 个 进程 能 
写 人 ETS 表 ， 如 采 它 损坏 了 表 里 的 数据 ， 也 会 影响 到 所 有 旋 取 这 个 表 的 进程 。 

如 果 你 使 用 的 ETS 表 类 型 是 private, 那么 你 的 程序 就 是 安全 的 。 上 述 结论 也 适用 于 DETS。 可 

以 创建 能 被 多 个 不 同 进程 写 入 的 共享 式 DETS 表 ， 但 不 辟 励 这 种 做 法 。 


























注意 ETS 和 DETS 原 本 并 不 是 为 了 独立 使 用 而 创建 的 ， 而 是 为 了 实现 Mnesia。 原 本 的 意图 是 如 
果 应 用 程序 想 要 模拟 进程 间 共 享 内 存 ， 就 应 该 使 用 Mnesia 的 事务 机 制 。 


26.2.3 ”避免 顺序 瓶颈 


当 我 们 使 程序 并 行 化 , 确保 有 大 量 进 程 并 且 没 有 共享 内 存 操作 后 , 接 下 来 的 问题 就 是 思考 顺 
序 瓶 有 令 。 有 些 事情 本 来 就 是 顺序 的 ， 如 打 问 题 本 号 具 有 “顺序 性 ”， 我 们 是 无 法 改变 这 一 点 的 。 
肝 些 事件 会 按照 顺序 发 生 ,， 无 论 我 们 有 多 努力 ， 都 无 法 改变 这 个 顺序 。 我 们 出 生 、 活 看 ， 然 后 死 
亡 。 我 们 改变 不 了 这 个 顺序 ， 无 法 让 这 些 事情 并 行 化 。 

顺序 瓶颈 指 的 是 多 个 并 发 进程 需要 访问 采种 顺序 资源 。 一 个 典型 的 例子 是 1O。 通 背 只 有 一 
个 人 磁盘， 对 这 个 磁盘 的 所 有 输出 最 终 都 将 是 顺序 的 。 这 个 磁盘 只 有 一 组 磁头 ， 而 不 是 两 组 ,我们 
无 法 改变 这 一 点 。 

每 次 创建 注册 进程 时 都 可 能 形成 一 个 顺序 瓶 贷 , 所 以 要 尽量 避免 使 用 注册 进程 。 如 果 需 要 创 
建 一 个 注册 进程 并 把 它 当 作 服 务 人 各， 就 要 确保 它 尽 可 能 快 地 响应 所 有 请 求 。 

在 很 多 时 候 , 解决 顺序 瓶 锋 的 唯一 方式 就 是 改变 相关 的 算法 , 没有 其 他 捷径 可 走 。 必 须 把 非 
分 布 式 算法 修改 成 分 布 式 算 法 。 这 个 主题 (分 布 式 算法 ) 有 大 量 的 研究 资料 可 供 参 考 , 但 是 在 传 
统 的 编程 语言 库 里 应 用 较 少 。 低 使 用 率 的 主要 原因 是 以 往 对 这 类 算法 的 需求 不 明显 ， 直到 为 网 络 
或 多 核 计算 机 编写 算法 时 才 有 所 改观 。 

为 多 核 CPU 或 永久 连接 互联 网 的 计算 机 编程 将 迫使 我 们 深入 研究 这 些 资 料 , 并 实现 其 中 一 些 
很 不 错 的 算法 。 

一 种 分 布 式 订 票 系统 

假设 我 们 有 一 种 资源 : 一 批 下 一 场 Strolling Bones 演 唱 会 的 票 。 为 了 确保 买 票 后 能 真正 得 型 
票 ， 传 统 上 会 使 用 单个 代理 来 订购 所 有 的 党 ,但 这 会 引入 一 个 顺序 租 贷 。 

要 避免 单个 代理 的 瓶 贷 , 可 以 设置 两 个 订 票 代理 。 在 销售 开始 时 , 第 一 个 订 票 代理 会 得 到 所 
有 偶数 编号 的 票 ， 第 二 个 订 票 代理 会 得 到 所 有 奇数 编号 的 紧 。 通 过 这 种 方式 ， 怠 能 确 你 代理 们 不 
会 两 次 销售 同一 张 票 。 

如 条 其 中 一 个 代理 卖 完 了 票 ， 它 可 以 回 另 一 个 代理 请 求 一 批 票 。 
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我 并 不 是 说 这 是 一 种 好 方法 , 因为 你 去 看 演唱 会 时 可 能 会 想 坐 在 朋友 劳 边 。 但 是 把 售 枝 处 一 
分 为 二 的 做 法 确实 消除 了 瓶颈 。 

这 种 把 单个 订 票 代理 替换 成 z 个 分 布 式 代理 〈(z 可 以 随时 间 而 变 )， 并 且 各 个 代理 可 以 加 入 和 
离开 售票 网 络 以 及 随时 前 泪 的 做 法 是 当前 热门 的 分 布 式 计 算 研 究 领 域 。 这 个 研究 领域 被 称 为 分 布 
式 散 列表 ( distributed hash tables )。 如 采 搜 索 这 个 名 词 ， 就 能 找到 大 量 的 相关 资料 。 


26.3 ”让 顺序 代码 并 行 


还 记得 我 们 着 重 介 绍 过 的 一 次 一 列表 操作 ( 特别 是 Lists:map/2 国 数 ) 吗 ? map/2 的 定义 
如 下 : 


map(_, []) | 
map(F, [HI|T]) -> [F(H)|map(F, T})]. 


一 种 让 顺序 程序 加 速 的 简单 策略 是 用 新 版 的 map ( 我 称 之 为 pmap ) 来 取代 所 有 map 调 用 ， 它 
会 并 行 执 行 所 有 的 参数 。 


调 

















lib_misc.erl 
pmap(F, L) -> 
9 = self(), 
%% Mmake_ref() 返回 一 个 唯一 的 引用 ， 
%% 和 梢 后 会 匹配 它 
Ref = erlang:make ref(), 
Pids = map(fun(I) -> 
spawn(fun() -> do f(S, Ref, F, 1) end) 
end, L), 
%% 收集 结果 
gather (Pids, Ref). 


do f(Parent, Ref, F, 1) -> 

Parent ! {self(), Ref, (catch F(TI))}. 
gather([Pid|T], Ref) -> 

receive 

{Pid, Ref, Ret} -> [Ret|gather(T, Ref)] 

end ; 
gather([], ) -> 

[]. 


pmap 的 工作 方式 类 似 于 map， 但 是 当 调用 pmap(F，L) 时 ， 它 会 为 L 里 的 每 个 参数 分 别 创建 一 
个 并 行进 程 然后 执行 。 请 注意 ， 执 行 L 里 各 个 参数 的 进程 没有 固定 的 完成 顺序 。 

gather 气 数 里 的 选择 性 receive 会 确保 返回 值 里 的 参数 顺序 符合 原始 列表 的 顺序 。 

map 和 pmap 有 一 点 语义 上 的 区 别 。 在 pmap 里 ， 我 们 使 用 catch F(H) 来 把 函数 映射 到 列表 上 ， 
而 在 map 里 直接 用 F(H) 。 这 是 因为 想 要 确保 pmap 能 正确 终止 , 避免 发 生计 算 F(H) 时 抛 出 异常 错误 
这 种 情况 。 如 果 没 有 抛 出 异常 错误 ， 这 两 个 函数 的 行为 就 是 相同 的 。 
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提示 最 后 这 名 话 严格 来 讲 并 非 完 全 正确 。 如 果 map 和 pmap 有 副作用 ， 那 么 它们 的 行为 就 会 有 
所 不 同 。 假 设 F(H) 包含 一 些 修改 进程 字典 的 代码 。 调 用 map 时 ， 对 进程 字典 的 修改 会 发 
生 在 调用 map 的 进程 里 。 


而 当 我 们 调用 pmap 时 ， 每 个 F(H) 都 在 它 自己 的 进程 里 执行 ， 所 以 如 果 使 用 了 进程 字典 ， 对 
字典 的 修改 就 不 会 影响 到 调用 pmap 的 进程 。 


警告 具有 副作用 的 代码 不 能 简单 地 用 pmap 取 代 map 调 用 来 实现 并 行 。 





何 时 使 用 pmap 
用 pmap 人 代替 map 并 不 是 加 速 程序 的 万 能 欧 。 下 面 是 一 些 需 要 考虑 的 事项 。 
1. 并 发 粒度 


如 有 果 限 数 要 做 的 工作 很 少 就 别 用 pmap。 假 设 我 们 要 做 这 个 : 

map(fun(I) -> 2*I end, L) 

这 个 fun 的 工作 量 很 小 。 建 立 进程 并 等 待 回复 的 开销 会 超过 用 并 行进 程 完成 任务 所 带 来 的 益 
处 。 

2. 不 要 创建 太 多 进程 

别 忘 了 pmap(F, L) 会 创建 Length(L) 个 并 行进 程 。 如 果 L 非 常 大 ， 就 会 创建 大 量 进程 。 最 好 
的 做 法 是 创建 lagom 数 量 的 进程 。Erlang 来 日 瑞 上 典 ，lagom 这 个 词 可 以 大 人 致 翻译 成 “不 太 少 ， 也 不 
太 多 ， 刚 刚好 ”。 有 人 认为 这 总 结 了 瑞典 人 的 性 格 。 

3. 思考 你 需要 的 抽象 

pmap 可 能 不 是 合适 的 抽象 。 有 许多 方式 可 用 来 把 果 数 并 行 映 射 到 列表 上 ， 这 里 选择 的 是 最 
简单 的 一 种 。 

刚才 使 用 的 pmap 版 本 关心 返回 值 里 的 元 素 顺 序 ( 用 选择 性 接收 来 处 理 )。 如 果 不 关 心 返回 值 
的 顺序 ， 就 可 以 这 么 写 : 














lib_misc.erl 


pmapl(F, L) -> 


5 = self!(), 
Ref = erlang:make ref(), 


foreach(fun(1) -> 
spawn (fun{() -> do fi{S, Ref, F, I) end) 
end, |), 
%% 收集 结果 
gatherl(length(L), Ref, {[]). 
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do fli(Parent，Ref，F， 开 ) -> 
Parent ! {Ref, (catch F(I) ) }， 


gatheri(0, ，Li -> |; 
gatherltN，Ref，L) -> 
receive 
{Ref, Ret} -> gatheri(N-1, Ref, [Ret|iL]) 
end. 
做 一 些 简 单 的 修改 就 能 把 它 变 成 一 个 并 行 的 foreach。 它 的 代码 类 似 于 前 面 这 个 , 但 我 们 不 
会 构建 任何 返回 值 ， 只 会 标注 程序 结 
为 一 种 方式 是 用 最 多 K 个 进程 来 实现 pmap， 其 中 K 是 一 个 固定 常数 。 如 采 想 把 pmap 用 于 非常 
大 的 列表 ， 那 么 这 种 方式 可 能 会 很 有 用 。 
另 一 个 版 本 的 pmap 可 以 把 计算 映射 到 分 布 式 网 络 的 节点 上 ， 而 不 仅仅 是 多 核 CPU 的 各 个 进 
程 上 。 
我 不 会 在 这 里 展示 如 何 实现 它 们 ， 你 可 以 目 己 思考 一 下 。 
本 节 的 目的 是 指出 你 可 以 用 基本 函数 spawn 、send 和 receive 来 轻松 构建 众多 抽象 。 你 可 以 
用 这 些 基 本 顶 数 创建 目 己 的 并 行 控 制 抽 象 ， 从 而 提升 程序 的 并 发 性 。 
和 前 面 一 样 ， 避 人 免 副 作用 是 提升 并 发 性 的 关键 。 永 远 别 忘 了 这 一 点 。 


26.4 小 消息 ， 大 计算 


谈 过 理论 之 后 ,现在 来 实际 测量 一 下 。 在 这 一 节 里 ,我 们 将 进行 两 个 实验 。 把 两 个 函数 分 别 
映射 到 一 个 包含 100 个 元 素 的 列表 上 ， 然 后 比较 并 行 映 射 和 顺序 映射 各 自 花 费 的 时 间 。 

我 们 将 使 用 两 组 不 同 的 问题 。 第 一 组 会 计算 : 

L = [L1, L2, ,..., L100], 

map(fun lists:sort/1, L) 

L 里 的 每 个 元 素 都 是 一 个 包含 1000 个 随机 整数 的 列表 。 

L = [27,27,...,, 27]， 

map(fun ptests:fib/1, L) 

这 里 的 L 是 一 个 包含 100 个 27 的 列表 ， 我 们 将 计算 列表 [fib(27)，fib(27)，...] (fib 是 
韭 波 纳 契 函数 )。 

给 这 两 个 函数 计时 ， 然 后 用 pmap 替 换 map 并 再 次 计时 。 

在 第 一 个 (排序 ) 计算 里 使 用 pmap 涉 及 在 不 同 进程 间 发 送 比 较 大 的 数据 ( 包含 1000 个 随机 
整数 的 列表 )， 但 排序 过 程 是 相当 快 的 。 第 二 个 计算 涉及 给 各 个 进程 发 送 一 个 很 小 的 请 求 (来 计 
算 fib(27) )， 但 递归 计算 fib(27) 的 运算 量 相 对 较 大 。 

因为 计算 fib(27) 涉 及 的 进程 间 数 据 复 制 很 少 ， 而 运算 量 相对 较 大 ,所 以 预计 第 二 组 问题 在 
多 核 CPU 上 的 性 能 会 胜 过 第 一 组 。 
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要 了 解 它们 的 实际 效果 ， 宕 要 一 个 脚本 来 进行 目 动 化 测试 。 不过， 前 先 来 看 如 何 局 动 SMP 
Erlang。 


运行 SMP Erlang 


对 称 多 人 处理 (Symmetric Multiprocessing， 人 简称 SMP ) 的 机 需 有 两 个 或 更 多 个 相同 的 CPU 连 
接 到 同一 块 共 至 内 存 。 这 些 CPU 可 以 属于 同一 块 多 核 已 厂 , 也 可 以 分 属 多 块 必 片 , 或 者 两 者 缘 有 。 
Erlang 能 在 许多 不 同 的 SMP 架 构 和 操作 系统 上 运行 。 当 前 系统 运行 在 文 持 一 个 或 两 个 处 理 帮 的 主 
板 上 ， 用 的 是 Intel 双 核 和 四 核 处 理 右 。 它 还 能 用 Sun 和 Cavium 处 理 融 运行 。 这 个 领域 的 开发 速度 
极 快 ， 每 个 版 本 的 Erlang 都 增加 了 一 些 操作 系统 和 处 理 锅 文 持 。 你 可 以 在 当前 Erlang 分 发 套 猴 的 
发 布 说 明 里 找到 最 新 信息 。( 点 击 http:/www.erlang.org/download.html 下 载 上 日 录 里 的 最 新 版 Erlang 
标题 。) 








注意 ， 从 R11B-0 版 的 Erlang 开 始 ，SMP Erlang 是 默认 启用 的 (也 就 是 说 默认 会 构建 SMP 虚 拟 机 )。 
要 在 其 他 平台 上 强制 构建 SMP Erlang， 就 应 当 给 configure 命 令 加 上 --enable-smp- 
support 标 记 。 


SMP Erlang 有 两 个 命令 行 标记 ， 它 们 将 决定 如 何在 多 核 CPU 上 和 运行。 
$erl -Smp +9 N 

@ -smp 
启动 SMP Erlang。 

@ +tSN 
用 N 个 调度 天 运行 Erlang。 每 个 Erlang 调 度 需 都 是 一 个 完整 的 虚拟 机 , 并 且 完 全 了 解 其 他 所 
有 虚拟 机 。 如 有 末 省 略 了 这 个 参数 ， 就 会 默认 设 为 SMP 机 带 上 的 逻辑 处 理 需 数量 。 

为 何 会 想 要 修改 这 个 值 ? 原因 如 下 。 

口 测量 性 能 时 ， 有 时 会 想 要 改变 调度 硕 的 数量 来 看 看 不 同 数 量 CPU 的 运行 效 采 。 

口 通过 修改 NM， 可 以 在 单 核 CPU 上 模拟 多 核 CPU 的 运行 。 

口 我 们 也 许 会 希望 调度 天 的 数量 超过 物理 处 理 需 的 数量 。 这 么 做 有 时 候 能 提升 硬 吐 量 ， 让 
系统 表现 得 更 好 。 这 些 效 末 尚 未 得 到 充分 理解 ， 属 于 活跃 的 研究 领域 。 

要 执行 测试 ， 需 要 一 个 脚本 来 运行 它们 。 





























runtests 
#!/bin/sh 
echo "" >results 
for i in123456789 10 11 12 13 14 15 16\ 
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 
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do 
echo $1 
erl -boot start clean -noshell -smp +S $1 \ 
-Ss ptests tests $i >> results 


done 

这 段 代 码 会 用 32 个 不 同 的 调度 希 局 动 Erlang， 运 行 计 时 测试 ， 然 后 把 计时 结果 归 集 到 一 个 名 
为 results 的 文件 里 。 

然后 需要 一 个 测试 程序 。 





ptests.erl 


-module (ptests)}). 

-export (Itests/1, fib/1i]). 
-import(lists, [map/2]). 
-Import(Lib misc, fpmap/2]). 


tests([Nj) -> 
Nsched = list to lnteger(atom to List(N) ) ， 
run tests(1, Nsched). 


run tests{N, Nsched) -> 
case test(N) of 
stop -> 
init:stop(); 
Val -> 
io:format("~p.~n", [{Nsched, Val}]1), 
run tests(N+1，Nsched ) 


end . 
test{(1) -> 
5 各 生成 100 个 列表 ， 
5 和 5 每 个 列表 都 包含 1000 个 随机 整数 
eed ( ) ， 


S 
Ss = Lists:sed( 工 100) ， 
L = map(fun( ) -> mkList(1000) end, S), 
{TImel，91+ timer:tc(lists, map, [fun lists:sort/i, Li), 
{Time2, S52} timer:tc(lib misc, pmap, [fun lists:sort/1, Li), 
{sort, Timel, Time2, equal {Ss1, S52)}; 
test{(2) -> 
J = [27,27,27,..]， 共 100 个 
= lists:duplicate(100, 27), 
ee Sl} = timer:tc{lists, map, [fun ptests:fib/i, L}), 
{Time2, S2} = timer:tc{(lib misc, pmap, [fun ptests:fib/i}, Lj]), 
{fib, Timel1, Time2, equal (S11, S2)},; 
test(3) -> 
stop., 


%% Equal 用 于 测试 map 和 pmap 的 计算 结果 是 否 相 同 
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equal (Ss,S) -> true; 
equal(S1,S2) -> {differ, Sl1, S2}. 


%% 递归 〈 低 效率 ) 的 非 波 那 契 


fib(0) -> 1; 
fib(1) -> 1; 
fib(N) -> fib(N-1) + fib(N-2). 


%% 重 置 随机 数 生 成 器 ， 
这 样 每 次 运行 程序 都 能 
%% 获得 相同 的 随机 数列 


seed() -> random:seed(44,55,66). 


%% 生成 包含 K 个 随机 数 的 列表 ， 
% 每 个 随机 数 都 在 1. .1000000 之 间 
mkList(K) -> mkList(K, []). 


mkList(0, L) -> L; 
mkList(N, L) -> mkList(N-1, [random:uniform(1000000)|L]). 


这 段 代 码 会 在 两 个 测试 案例 里 分 别 运行 nap 和 pmap。 结 果 如 图 26-1 所 示 ， 我 们 用 点 标 绘 了 
pmap 和 map 所 用 时 间 之 比 。 








SUN Fire T2000 服务 器 的 多 核 性 能 








0 5 10 15 20 25 30 35 
CPU 数量 


图 26-1 


如 你 所 见 , 消息 传递 少 的 CPU 密 集 型 计算 能 够 线性 加 速 , 而 消 筷 传递 多 的 轻 量 型 计算 就 没有 
那么 好 的 可 伸缩 性 了 。 
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最 后 需要 说 明 的 是 ,不 应 该 过 度 解 读 这 些 图 表 。SMP Erlang 每 天 都 在 改进 ， 所 以 今天 是 事实 
不 代表 明天 还 是 事实 。 但 是 ， 可 以 说 这 些 结果 非常 玛 舞 人 心 。 爱 立信 正在 构建 的 商业 产 
核 处 理 需 上 跑 出 近乎 两 倍 的 速度 ， 所 以 我 们 非常 开心 。 








品 能 在 双 
26.5 用 mapreduce 使 计算 并 行 化 
现在 我 们 将 把 理论 转化 成 实践 。 首 先 来 看 高 阶 遇 数 mapreduce,， 然 后 展示 如 何 用 它 来 让 一 种 
简单 的 计算 并 行 化 。 
mapreduce 


通过 图 26-2 来 了 解 一 个 mapreduce 的 基本 概念 。 图 中 这 些 映 射 (map ) 进程 会 生成 由 {Key， 
Value} 对 组 成 的 消息 流 ， 并 发 送 给 一 个 化 简 ( reduce ) 进程 进行 合并 ， 后 者 会 把 具有 相同 键 的 对 
组 合 在 一 起 。 


{Key, Val! Cy ) 


{Key, Val} 
{Key, Val} 
M = 上 映射 进程 


R= 化 简 进 程 人 Cu ) 


mapreduce 上 下 文 里 的 map 和 本 书 其 他 地 方 出 现 的 map 骂 数 完全 不 
mapreduce 是 一 个 


并 行 融 阶 函 考 


{Key, Val 


] 性 


图 26-2 
全 
已 


2 一 一 


同 。 


数 。 它 
据说 谷歌 的 服务 从 集群 每 天 都 在 使 用 它 。 


。 它 是 由 谷歌 公司 的 Jeffrey Dean 和 Sanjay Ghemawat 提 出 的 ， 
可 以 用 许多 不 同 的 方式 和 语义 实现 mapreduce 
算法 。 


mapreduce 的 定义 如 下 : 





其 实 更 像 是 一 系列 算法 ,而 不 是 某 种 具体 
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-Spec mapreduce(F1，F2，AccO，L) -> AcC 
Fl = fun(Pid, X) -> void 
F2 = fun(Key, [Value], AccO) -> Acc 
L = [X] 
Acc = XX = term() 
口 F1(Pid，X) 是 映射 函数 。 
F1 的 任务 是 发 送 一 个 {Key，VatLue} 消 息 流 到 Pid 进 程 ， 然 后 终止 。mapreduce 会 为 列表 上 L 
里 的 每 一 个 X 值 分 裂 出 一 个 全 新 进程 。 
口 F2(Key，[Value]，Acc0) -> Acc 是 化 简 函 数 。 
当 所 有 映射 进程 都 终止 时 , 化 简 丽 数 台 应 该 已 经 合并 某 个 键 的 所 有 值 了 。 mapreduce 随 后 
对 收集 的 各 个 {Key，[Value]} 元 组 调用 F2(Key，[Value]，Acc)。Acc 是 一 个 初始 值 为 
Accg 的 归 集 硕 ，F2 会 返回 一 个 新 的 归 集 入 。( 为 一 种 描述 方式 是 F2 对 收集 的 {Key， 
[Value]} 元 组 执行 了 折 芝 操作。 ) 
Accg 是 归 集 融 的 初始 仁 ， 在 调用 F2 时 使 用 。 
口 L 是 一 个 由 X 值 组 成 的 列表 。 
F1(Pid，X) 会 被 用 于 L 里 的 每 一 个 X 值 。Pid 是 化 简 进程 的 标识 符 ， 它 是 由 mapreduce 创 
建 的 。 
mapreduce 是 在 phofs (parallel higher-order functions 的 简写 ， 即 并 行 高 阶 函 数 ) 模块 里 定 
义 的 。 














phofs.erl 


-module (phofs). 
-export( [mapreduce/4]1). 
-import(lists, [foreach/2]). 


Fl(Pid,X) -> 发 送 {Key,Val} 消息 到 Pid 
%% F2(Key, [Val], AccIn) -> AccOut 
mapreduce (Fl, F2, AccO, L) -> 
S = self(), 
Pid = spawn(fun() -> reduce(s, Fl, F2, AccO, L) end), 
receive 

{Pid, Result} -> 

Result 

end. 


reduce (Parent, Fil, F2, AccO, L) -> 
process flag(trap exit, true), 
ReducePid = self(), 
%% 创建 一 些 Map 进 程 ， 
%% 分 别 用 于 L 里 的 各 个 X 元 素 
foreach (fun(X) -> 
spawn_ link(fun() -> do_ job(ReducePid，F1，X) end) 
end, L), 
N = Length(L), 
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%% 生成 一 个 字典 来 保存 各 个 Key 

DictO = dict:new!(), 

%% 等 待 N 个 Map 进 程 终止 

Dictl = collect replies(N, Dict0), 
Acc = dict:fold(F2, AccO, Dict1), 
Parent ! {self(), Acc}., 


%% collect replies(N, Dict) 
收集 与 合并 来 自 N 个 进程 的 {Key，Value} 消 息 
N 个 进程 都 终止 后 返回 一 个 包含 
{Key，[Value]} 元 组 的 字典 


oo 
oe 


QQ 
ee 


oe 
De 


collect replies(0, Dict) -> 
Dict; 
collect replies(N, Dict) -> 
receive 
{Key, Val} -> 
case dict:1is key (Key, Dict) of 
true -> 
Dictl1 = dict:append(Key, Val, Dict), 
collect replies(N, Dict1), 
false -> 
Dictl1 = dict:store(Key, [Val], Dict), 
collect replies(N, Dict1) 
end; 
{'EXIT', ， Why} -> 
collect replijes(N-1, Dict) 
end. 


%% Call F(Pid, X) 
%% 『F 必 须发 送 {Key，Value} 
%% 消息 到 Pid， 然 后 终止 


do_job(ReducePid, F, X) -> 
F(ReducePid, X)., 


进入 下 一 步 之 前 ， 我 们 将 测试 napreduce 来 彻底 型 明白 它 的 工作 方式 。 
编写 一 个 小 程序 来 统计 本 书 所 附 代 码 目录 里 所 有 单词 的 出 现 次 数 。 这 个 程序 如 下 : 








test_mapreduce.erl 


-module(test mapreduce)., 
-compile(export all). 
-import(lists, [reverse/1, sort/1]). 


test() -> 
wc dir("."). 


WwWC_ dir(Dir) -> 
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Fl = fun generate words/2, 

F2 = fun count words/3, 

Files = lib find:files(Dir, "*.eri", false), 
L1 = phofs:mapreduce(F1, F2, [}]}, Files), 
reverse(sort{(i1)). 


generate words(Pid, File) -> 
F = fun(Word) -> Pid i: {Word, 1} end, 
Llib misc:foreachWordIinFile(File, F). 
count words(Key, Vals, A) -> 
[{lLength(Vals), Key} |Al]. 


1> test 
[{341," 
{330," 
{318," 
{265," 
{235," 
{214," 
{213," 
{205," 
{196," 
{194," 
{185,"file"}, 
{177,"Pid"}, 


mapreduce: test(). 
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当 我 运行 它 时 ， 代 码 目 录 里 有 102 个 Erlang 模 块 。mapreduce 创 建 了 102 个 并 行进 程 ， 每 个 进 
程 都 问 化 简 进 程 发 送 了 包含 对 的 消息 流 。 它 应 该 能 在 100 核 的 处 理 右 上 流畅 运行 ( 如 有 果 磁 盘 能 跟 
得 上 的 话 )。 

刚 开 始 研 发 Erlang 的 时 候 (1985 年 )， 根 本 没 想 到 并 行 计算 机 会 随处 可 见 ， 也 没 想到 计算 机 
集群 可 以 放 入 单个 改 片 。Erlang 被 设计 用 来 编写 容错 式 计算 机 集群 。 要 实现 容错 ， 必 须 拥 有 一 台 
以 上 的 机 器 ， 而 且 程 序 必须 兼顾 并 发 和 并 行 运行 。 

多 核 CPU 出 现 以 后 , 我 们 发 现 许 多 程序 的 速度 直接 变 快 了 。 这些 程序 是 用 并 行 执行 的 方式 编 
写 的 ， 我 们 要 做 的 就 是 用 并 行 硬 件 来 运行 它们 。 

Erlang 没 有 提供 pmap 和 mapreduce 这 样 的 并 行 抽象 ， 而 是 提供 了 一 小 组 基本 蚂 数 (spawn、 
send 和 receive ) 来 帮助 你 构建 这 些 抽象 。 这 一 章 展 示 了 如 何 用 底层 基本 曙 数 来 构建 pmap 这 样 的 
事物 。 

到 目前 为 止 , 我 们 已 经 在 本 书 里 介绍 了 许多 基本 知识 , 包括 标准 库 和 OTP 框 架 的 主要 组 成 部 
分 ， 如 何 制作 一 个 独立 的 系统 ， 以 及 如 何在 分 布 式 系统 和 多 核 CPU 上 构建 程序 。 

在 下 一 章 将 直接 进入 一 个 应 用 程序 , 它 会 用 到 在 本 书 前 面 开 发 的 许多 技术 。 我 们 还 将 解决 福 
尔 摩 斯 的 最 后 一 案 。 
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26.6 ”练习 


让 计算 并 行 化 往往 能 大 大 加 快 啊 应 速度 ， 我 们 将 在 下 面 这 些 例 子 里 展示 这 一 点 。 

(1) 我 们 在 17.1.1 市 里 编写 了 一 个 获取 网 页 的 程序 ,修改 这 个 程序 , 用 HEAD 命 令 取代 GET 命 令 。 
可 以 通过 发 送 HTTP HEAD 命 令 来 测量 网 站 的 啊 应 时 间 。 服务 硕 啊 应 HEAD 命 令 时 只 会 返回 网 页 的 头 
部 ， 不 会 返回 主体 。 编 写 一 个 名 为 web_profiter:ping(URL，Timeout ) 的 函数 来 测量 URL 这 个 
网 站 地 址 的 啊 应 速度 。 它 应 当 返 回 {time，T} 或 者 timeout。 

(2) 制作 一 个 包含 大 量 网 站 的 列表 L， 记 录 Lists:map(fun(I) -> web profiler:ping 
(URL，Timeout) end，L) 所 花费 的 时 间 。 它 也 许 会 运行 很 信 ， 最 坏 情 况 下 是 Timeout x 
Length(L) 。 

(3) 用 pmap 代 奉 map 重 复 刚 才 的 计时 。 现 在 所 有 的 HEAD 请 求 都 应 当 是 并 行 的 。 因 此 ， 最 坏 情 
况 下 的 啊 应 时 间 就 是 Timeout。 

(4) 把 结果 保存 在 一 个 数据 库 里 ， 然 后 制作 一 个 Web 接 口 来 查询 这 个 数据 库 。 可 以 从 第 24 章 
里 开发 的 数据 库 和 Web 服 务 器 代码 人手。 

(5) 如 果 你 用 一 个 超 长 的 元 素 列 表 调 用 pmap ， 就 可 能 会 创建 出 过 多 的 并 行进 程 。 编 写 一 个 名 
为 pmap(F，L，Max) 的 函数 来 并 行 计算 列表 [F(I) || 工 <- L], 但 限制 它 同时 最 多 只 能 运行 Max 
个 并 行进 程 。 

(6) 编写 一 个 新 版 的 pmap， 让 它 能 工作 在 分 布 式 Erlang 上 ， 把 任务 分 派 给 多 个 Erlang 广 点 。 

(7) 编写 一 个 新 版 的 pmap， 让 它 能 工作 在 分 布 式 Erlang 上 ， 把 任务 分 派 给 多 个 Erlang 闻 点 ， 并 
日 实现 各 个 市 点 之 间 的 任务 负载 均衡 。 

















“我 们 有 一 小 块 程序 肆 片 ,” 阿 姆 斯 特 明 说 ,，“ 但 是 不 知道 它 来 目 哪 里 或 者 写 的 是 什么 。” 

“给 我 看 看 。 福尔摩斯 说 。 

“就 是 这 个 。” 阿 姆 斯 特 明说 。 他 信 下 号 子 罪 近 福 尔 译 斯 ， 癌 他 展示 一 张 纸 片 ， 上 面 写 满 各 种 
奇怪 的 符号 、 括 号 和 箭头 ， 还 掺 杂 着 一 些 英 文 文本 。 

“这 是 什么 ?”” 阿 姆 斯 特 明 问 ,“ 雷 斯 垂 矢 说 它 是 一 种 来 自 未 来 的 强力 黑 魔 法 。 

“这 是 计算 机 程序 的 一 部 分 ,” 和 福尔摩斯 一 边 说 一 边 抽 寿 烟斗 ,“ 我 在 时 间 旅 行 中 曾经 设法 从 
未 来 传 回 过 一 台 计 算 机 和 大 量 文件 。 根 据 这 些 文件 , 我 发 现 Erlang 的 邮件 列表 里 有 73 445 封 邮件 。 
我 想 , 要 是 把 纸 片 上 的 文学 和 这 些 邮 件 进行 对 比 ， 就 能 找 出 这 些 奇 怪 符号 的 音 思 。 但 是 该 怎么 做 
呢 ? 我 取出 小 提 共 ， 弹 邯 了 一 段 则 格 尼 尼 的 曲子 ,然后 有 了 思路 。 最 接近 纸 户 文字 的 邮件 列表 项 
必然 能 让 文档 词汇 的 TF*IDF 分 数 具 有 最 大 的 余弦 相似 度 ……” 

“很 精彩 ,” 阿 姆 斯 特 明说 ,，“ 但 什么 古 TF*IDF 分 数 ?” 

“这 很 简单 ， 我 杂 爱 的 阿 姆 斯 特 明 ,” 和 福尔摩斯 况 ,“ 它 是 词汇 频 度 乘 以 逆 文 档 频 度 。 我 来 解 
释 一 下 couds 


27.1 找 出 数据 的 相似 度 


在 写作 本 书 时 ，Erlang 的 邮件 列表 ?里 包含 73 445 封 邮件 。 它 们 代表 了 庞大 的 知识 储备 ， 可 以 
用 多 种 方式 加 以 利用 。 我 们 可 以 用 它 来 回答 关于 Erlang 的 问题 ， 也 可 以 从 中 寻找 灵感 。 
如 有 果 你 正在 编写 一 个 程序 并 且 和 需要 帮助 ， 就 可 以 找 sherlock ( 福尔摩斯 ) 帮忙 。sherlock 会 分 
析 你 的 程序 ， 从 Erlang 列 表 里 找 出 现存 最 相似 的 邮件 ， 然 后 把 这 些 可 能 有 用 的 资料 提供 给 你 。 
现在 来 看 看 总 体 方案 。 第 一 步 是 下 载 整 个 Erlang 邮 件 列 表 然 后 本 地 存储 它 。 第 二 步 是 组 织 3 
解析 所 有 的 邮件 。 第 三 步 是 计算 邮件 的 某 些 属性 ， 以 便 进 行 相似 度 搜索 。 第 四 步 是 进行 邮件 查询 
来 找到 与 你 的 程序 最 相似 的 邮件 。 
这 就 是 本 章 的 核心 概念 。 具 体 的 做 法 有 很 多 种 ， 可 以 下 载 现存 的 所 有 Erlang 模 块 然 后 进行 相 
似 度 搜索 ， 也 可 以 下 载 一 个 庞大 的 推 特集 合 ， 或 者 任何 感 兴趣 的 数据 集 。 









































GD http://erlang.org/pipermail/erlang-questions/ 
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还 有 一 种 方法 可 以 帮助 你 归 类 数据 。 假 设 你 刚刚 写 了 一 小 段 笔记 , 想 把 它 保存 在 一 个 文件 里 。 
次 定 用 什么 文件 名 或 目录 来 保存 这 个 文件 是 个 难题 。 也 许 它 和 几 年 前 我 在 磁盘 里 写 的 文件 很 相 
似 , 或 者 某 个 我 根本 不 认识 的 人 也 写 过 类 似 的 文件 。 在 这 些 情形 下 ,我 希望 能 从 一 个 极其 庞大 的 
文档 集合 里 找 出 最 接近 它 的 文档 。 

sherlock 能 在 我 们 不 知道 存在 相似 性 时 找 出 事物 之 间 的 相似 性 ,我 们 用 它 来 寻找 Erlang 邮 件 列 
表 里 的 相似 内 容 。 

深入 sherlock 的 实现 细 布 之 前 ， 先 来 展示 一 下 它 的 威力 。 








27.2 sherlock 演示 


在 这 一 丰 里 ， 我 们 将 试用 一 下 sherlock。 首 先 必须 初始 化 sherlock， 做 法 是 从 Erlang 的 邮件 列 
表 存 档 里 获取 并 分 析 数 据 。 做 完 这 些 之 后 ， 就 能 以 多 种 方式 查询 数据 了 。 


27.2.1 获取 并 预 处 理 数据 
这 一 节 里 的 某 些 命令 会 花费 很 长 时 间 ， 所 以 只 执行 一 次 。 首 先 来 初始 化 系统 。 


1> sherlock:init()., 
Making ${HOME}/.sherlock/mails 
sherlock cache_created 


这 个 命令 会 在 你 的 主 目 录 下 创建 一 个 目录 结构 。 如 果 环 境 变 量 HOME 未 设置 ， 它 就 会 失败 。 
sherlock 会 把 所 有 数据 都 保存 在 顶级 目录 ${HOME}/ .sherLock 下 的 目录 结构 里 。 


2> sherlock:fetch Index( ) . 
Written: /Users/joe/.sherlock/mails/questions.html 
Written: /Users/joe/.sherlock/mails/questions.term 
176 files must be fetched 


fetch-index 会 获取 Erlang 邮 件 列 表 里 的 邮件 索引 。 该 索引 是 一 个 HTML 文 件 ， 我 们 可 以 从 
中 提取 出 所 有 保存 邮件 的 文件 名 列表 。 


3> sherlock:fetch mails(). 
fetching:"http://erlang.org/pipermail/erlang-gquestions/1997-January,.txt.,gz" 
written:/Users/joe/.sherlock/mails/cache/1997-January.txt.gz 
fetching:"http://erlang.org/pipermail/erlang-gquestions/1997-May.txt.gz" 
written:/Users/joe/.sherlock/mails/cache/1997-May .txt.gz 











有 了 这 些 文件 名 , 我 们 要 做 的 就 是 下 载 它 们 。 每 个 文件 名 都 包含 年 和 月 。 把 下 载 的 所 有 文件 
都 保存 在 名 为 ${HOME}/ .sherlock/mail/cache 的 目录 里 ， 这 些 数据 应 该 保留 到 不 再 运行 程序 
为 止 。 我 在 写作 这 一 章 并 运行 前 面 的 命令 后 一 共 下 载 了 176 个 文件 437MB 的 压缩 邮件 数据 )， 它 
们 代表 了 73 445 封 邮件 。 

可 以 加 sherlock 了 解 已 收集 数据 的 信息 。 
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4> sherlock:mail years!(). 

["1997","1998","1999","2000","2001","2002","2003","2004", 

"2005","2006","2007","2008","2009","2010","2011","2012", 

"2013"] 

这 说 明 已 经 成 功 下 载 了 从 1997 年 到 2013 年 的 邮件 。 

下 一 步 是 把 数据 按 年 归 类 , 我 们 将 为 每 个 年 份 创建 一 个 新 目录 。 例如 ，2007 年 的 数据 会 被 保 
存在 ${HOME}/ .sherlock/mail/2007 目 录 里 ， 以 此 类 推 。 接 下 来 会 集中 每 一 年 的 所 有 邮件 ， 然 
后 把 结果 写 入 合适 的 目录 。 做 完 这 些 之 后 ,我们 将 解析 并 后 处 理 每 一 年 的 数据 。 

5> SherLock:process all years(). 


Parsing mails for: 1997 
Parsing: 1997-January ,txt ,gz 








1997 had 3 mails 


Parsing mails for: 1999 
Parsing: 1999-January ,txt ,gz 
Parsing: 1999-February .txt.gz 


1999 had 803 mails 
2009 had 7906 mails 


73445 files in 215 seconds (341.6 files/second) 


这 会 花 几 分 钟 时 间 ， 产 生 17MB 的 数据 。 你 只 需要 做 一 次 。 
27.2.2 “寻找 最 像 给 定 文件 的 邮件 


现在 已 经 准备 好 搜索 数据 了 , 查询 项 是 我 正在 编写 的 文件 。 开 发 这 个 程序 时 , 我 正在 编写 一 
个 名 为 shertock tfidf 的 模块 。 我 很 想 知 道 这 个 搜索 引擎 是 否 能 正 浓 工作 ， 于 是 我 输入 了 以 下 
查询 命令 : 


1> sherlock:find mails similar to fille("2009"，",/Src/sherLock tfidf.erl"). 
** searching for a mail in 2009 similar to the file:./src/sherlock tfidf.erl 
Searching for=[<<"idf">>,<<"Word">>,<<"remove'">>,<<'"Wwords'">>,<<"tab">>, 
<<"duplicates'">>,<<"ets">>,<<"keywords">>,<<"bin">>,<<"skip">>, 
<<"file">>,<<"index">>,<<"binary">>,<<"frequency">>,<<"dict">>] 

7260 : 0.27 Word Frequency Analysis 














7252 : 0.27 Word Frequency Analysis 

7651 : 0.18 tab completion and word killing in the shell 

4297 : 0.17 ets vs process-based registry + local vs global dispatch 
5324 : 0.16 ets memory usage 

5325 : 0.15 ets memory usage 

1917 : 0.14 A couple of design questions 

1860 : 0.12 leex and yecc spotting double newline 

5361 : 0.11 dict slower than ets? 
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1991 : 0.11 Extending term external format to support shared substructures 

[7260 ,7252,7651,4297,5324,5325,1917,1860,5361,19911] 

这 个 查询 命令 让 sherlock 在 2009 年 的 邮件 里 搜索 与 sherlock tfidf.ert 文 件 的 内 容 相似 的 
邮件 。 

输出 的 结果 很 有 意思 。 首 先 ，sherlock 认 为 最 能 描述 sherlock tfidf.erl 的 是 idf 和 word 
这 些 关 键 词 ,它们 被 列 在 了 “searching for”( 搜索 项 ) 这 一 行 。 随后，sherlock 在 所 有 发 表 于 2009 
年 的 邮件 里 搜索 这 些 关 键 词 。 它 的 输出 如 下 : 

7260 : 0.27 Word Frequency Analysis 

7252 : 0.27 Word Fregquency Analysis 


7651 : 0.18 tab completion and word kiLting in the ShetL 
4297 : 0.17 ets vs process-based reglstry + local vs global dispatch 

















每 一 行 痢 有 一 个 邮件 索引 编号 , 然后 是 相似 度 权 重 和 标题 行 。 相 似 度 权重 是 一 个 0 到 1 之 间 的 
数字 ，] 意 味 痢 文档 非常 相似 ，0 则 是 坚 无 相似 性 。 得 分 最 高 的 邮件 是 编号 为 7260 的 邮件 ， 它 的 相 
似 度 权 重 是 0.27。 看 上 去 有 点 意思 ,我们 来 了 解 一 下 它 的 详细 内 容 。 

2> sherlock:print mail("2009", 7260). 

















ID: 7260 

Date: Fri, 04 Dec 2009 17:57:03 +0100 
From: 

Subject;: Word Frequency Analysis 
Hello! 


I need to compute a word frequency analysis of a fairly Large corpus. At 
present I discovered the disco database 
http://discoproject.org/ 


which seems to include a tf-idf indexer. What about couchdb? I found an 
article that it fails rather quickly (Somewhere between 100 and 1000 
wikipedia text pages) 


当 我 第 一 次 运行 它 时 ， 结 来 让 我 非常 激动 。 系 统 发 现 了 一 封 讨论 TF*IDF 指 数 的 邮件 ， 而 我 
并 没有 特意 让 它 寻 找 TF*IDF 指 数 ， 我 只 是 说 “去 寻找 与 文件 内 部 代码 相似 的 所 有 邮件 ”。 
现在 我 知道 邮件 7260 质 有 看 涉 。 或 许 还 有 别 的 邮件 与 这 封 邮件 相似 ， 我 们 来 问 问 sherlock。 


3> sherlock:find mails similar to mail("2009", "2009", 7260), 
Searching for a mail in 2009 similar to mail number 7260 in 2009 
Searching for=[<<"indexer">>,<<"anNnalysis'">>,<<"Ccouchdb">>,<<"wortd">>, 
<<"idf">>,<<"Kknuthellan.com">>,<<"frequncy">>,<<"COrpUus">>, 
<<"dbm">>,<<"discoproject .org'">>,<<"d1isco">>] 

7252 : 0.84 Word Fredquency Analysis 

6844 : 0.21 couchdb in Karmic Koala 

6848 : 0.21 couchdb in Karmic koala 
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6847 ; 0,20 couchdb In Karmic Koala 
6849 :; 0.19 couchdb in Karmic Koala 


7264 : 0.17 Re: erlang search engine library? 

6843 : 0.16 couchdb in Karmic Koala 

2895 ; 0.15 CouchDB integration 

69 : 0.14 dialyzer fails when using packages and -r 
[7252,6844,6848,6847,6849,7264,6843,2895,69] 


这 一 次 我 搜索 的 是 类 似 7260 的 邮件 。 邮 件 7252 有 着 最 高 的 相似 度 得 分 , 而 且 的 确 与 7260 很 相 
似 , 但 是 最 终 邮件 7264 更 让 我 感 兴趣 。 光 途 相 似 度 得 分 不 足以 判定 哪些 文件 是 我 们 想 要 的 ， 系统 
只 是 提供 了 可 能 相似 的 文件 。 我 们 必须 查看 结果 然后 选择 认为 最 有 意思 的 邮件 。 

从 sherlock tfidf.erl 的 代码 入手 ， 我 发 现 disco 数 据 库 有 一 个 TF*IDF 指 数 工 具 ， 几 次 查 
询 后 我 又 找到 了 与 couchdb 的 联系 。sherlock 能 找到 各 种 有 意思 的 东西 供 我 进一步 分 析 。 


27.2.3 搜索 指定 作者 、 日 期 或 标题 的 邮件 


还 可 以 执行 所 谓 的 单项 〈faceted ) 数据 搜索 。 文 档 的 单项 是 指 用 户 名 或 标题 之 类 的 字段 , 单 
项 搜索 "是 指 限 于 特定 字段 或 字段 组 的 搜索 。 解析 后 的 文档 用 Erlang 记 录 表 示 , 我 们 可 以 对 所 有 文 
档 执 行 任意 字段 的 指定 搜索 。 这 里 有 一 个 单项 搜索 的 例子 : 

1> sherlock:search mails regexprs("2009", "*Armstrong*", "*Protocol*", "*")., 

946 : UBF and JSON Protocols 

5994: Message protocol vs，Function call API 


Query took:23 ms #results=2 
[946 ,5994 ] 


它 搜 索 了 满足 以 下 条 件 的 2009 年 邮件 : 作者 名 匹配 正则 表达 式 *Armstrong*， 标 题 行 匹配 
*Protocol*， 内 容 不 限 。 最 终 找 到 了 两 封 匹 配 邮 件 : 946 和 5$994。 可 以 像 下 面 这 样 检查 第 一 封 邮 
件 : 


2> SherLock:print mail("2009", 946). 






































ID: 946 

Date: Sun, 15 Feb 2009 12:39:10 +0100 

From: Joe Armstrong 

Subject: UBF and JSON Protocols 

For a Long time 1 have been interested In describing protocols. In 
2002 I published a contract System called UBF for defining protocols. 


第 二 封 也 是 如 此 。 在 这 个 阶段 , 可 以 执行 更 多 查询 , 搜索 特定 数据 或 者 寻找 与 前 面 这 些 邮件 
相似 的 邮件 。 
看 了 sherlock 的 演示 之 后 ， 再 来 看 看 它 的 实现 方式 。 





GD http://en.wikipedia.org/wiki/Faceted search 





386 第 27 章 福尔摩斯 的 最 后 一 案 


27.3 ”数据 分 区 的 重要 性 


告诉 你 一 个 秘密 ， 给 数据 分 区 是 让 程序 并 行 的 关键 。 用 来 构建 数据 存储 的 process_ 
all_years() 是 这 样 定 义 的 : 


process all years() -> 
[process year(I) || I <- mail years()]. 


process year(Year) 会 处 理 某 一 年 份 的 所 有 数据 , 而 mail_years/0 会 返回 一 个 年 份 列表 。 

要 让 程序 并 行 ， 只 需 修改 process_all years 的 定义 并 调用 pmap ( 在 26.3 节 里 讨论 过 )。 做 
了 这 些小 改动 之 后 ， 我 们 的 函数 看 起 来 就 像 下 面 这 样 : 

process all years() -> 

lib misc:pmap(fun(1) -> process year(1) end, mail years()). 

这 人 么 做 还 有 一 个 额外 的 不 太 明 显 的 好 处 。 要 测试 程序 能 否 工作 ， 只 需要 处 理 其 中 一 个 年 份 。 
如 有 果 有 一 台 17+ 核 的 蜗 端 机 各 ， 就 可 以 并 行 计算 所 有 的 年 份 。 因 为 总 共有 17 年 的 数据 ， 所 以 需要 
至 少 17 核 的 CPU 以 及 允许 同时 进行 17 个 输入 操作 的 磁盘 控制 融 。 现 代 的 固态 便 盘 有 多 个 磁盘 控制 
条 ,但 在 创作 本 书 时 使 用 的 机 天 只 有 传统 的 便 盘 和 双核 处 理 带 , 所 以 让 程序 并 行 化 恕 人 并 不 能 ! 
车 提升 速度 。 

我 一 了 通过 分 析 2009 年 的 数据 来 测试 这 个 程序 。 如 果 想 加 速 程序 , 就 需要 使 用 高 端 机 入， 而 
我 刚刚 把 顶层 的 列表 推导 修改 为 pmap 来 使 程序 并 行 化 。 

这 种 并 行 化 方式 正 是 映射 -化 简 染 构 所 使 用 的 。 为 了 快速 搜索 邮件 数据 ， 我 们 会 使 用 17 台 机 
从 ， 让 每 一 台 机 带 分 别 搜索 一 年 的 数据 。 把 同一 个 查询 命令 发 往 全 部 17 台 机 带 ， 然 后 收集 结果 。 
这 就 是 map-reduce 的 精髓 ，26.5 方 对 此 进行 了 讨论 。 

你 会 注意 到 这 一 草 里 的 所 有 示例 都 使 用 2009 作 为 基准 年 份 .2009 年 有 足够 多 的 邮件 来 操练 所 
有 软件 〈 共 计 7 906 封 邮件 )， 而 处 理 这 些 数量 的 邮件 也 不 会 花费 太 长 时 间 ， 这 一 点 在 开发 软件 时 
很 重要 ， 因 为 程序 需要 修改 并 运行 很 多 次 。 

因为 我 把 数据 按 年 份 组 织 成 独立 的 集合 , 所 以 只 需要 编写 针对 其 中 某 一 年 的 代码 。 如 东 有 必 
要 的 话 ， 我 的 程序 稍 作 修改 承 能 在 更 强力 的 机 和 硕 上 运行 。 


27.4 给 邮件 添加 关键 词 


观察 Erlang 邮 件 列 表 里 的 邮件 ， 就 会 发 现 它们 不 夷 任何 关键 词 。 但 即使 有 关键 词 ， 还 是 会 出 
现 一 个 更 深层 次 的 问题 。 阅读 同一 份 文档 的 两 个 人 可 能 会 对 应 该 用 哪些 关键 词 来 摘 述 文档 产生 争 
议 。 因此， 当 我 执行 关键 词 搜索 时 ,如 采 文 档 作 者 选择 的 关键 词 与 我 选择 的 不 同 , 搜索 就 不 灵 了 。 

sherlock 会 为 邮件 列表 里 的 每 一 封 邮件 计算 关键 词 回 量 。 我 们 可 以 问 问 它 从 2009 年 的 邮件 946 
里 得 出 了 什么 关键 词 癌 量 。 
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1> SherLock:get _ keyword vector("2009", 946)., 
[{"protocols",0.6983839995773734},， 
{"json",0.44660371850799946}， 
{"ubf",0.38889626945542854}， 
{"widely",0.2507841072279312}，, 
{"1.html",0.17649029959852883}， 
{"recast",0.17130091468424488}， 





关键 词 向 量 是 一 个 列表 , 包含 得 出 的 关键 词 和 该 词 在 文档 里 的 重要 性 。 词汇 在 文档 里 的 重要 
性 其 实 是 该 词 在 文档 里 的 TF*IDF" 权 重 。 它 是 一 个 介 于 0 和 1 之 间 的 数字 ，0 代 表 不 重要 ，1 代 表 非 
常 重要 。 

为 了 计算 两 个 文档 的 相似 度 , 我 们 会 分 别 计 算 它 们 的 关键 词 向 量 , 然后 计算 这 些 关键 词 向 量 
的 归 一 化 向 量 积 ( normalized cross product ), 它 被 称 为 文档 的 余弦 相似 度 ”"。 如 果 两 个 文档 的 关键 
词 有 重症 ， 它 们 就 存在 一 定 的 相似 度 ， 人 余弦 相似 度 就 是 衡量 这 一 点 的 。 

现在 来 看 看 算法 的 细节 。 





























27.4.1 词汇 的 重要 性 : TF*IDF 权 重 


关键 词 重 要 性 的 一 个 常用 量度 就 是 所 谓 的 TF*IDF 权 重 。TF 代 表 term frequency( 词汇 频 度 )， 
IDF 代 表 inverse document frequency( 逆 文 档 频 度 )。 许 多 搜索 引擎 使 用 词汇 在 文档 里 的 TF*IDF 权 
重 来 评价 词汇 的 重要 性 和 寻找 集合 里 的 类 似 文档 。 在 这 一 节 里 ， 我 们 将 来 看 看 TF*IDF 权 重 是 如 
何 计算 的 。 

在 描述 搜索 方法 的 资料 里 ， 你 会 发 现 语料库 ( corpus ) 这 个 词 经 常 出 现 。 语 料 库 是 一 个 大 型 
的 参考 文档 集 。 在 本 书 的 宁 例 中 ,语料库 是 Erlang 邮 件 列表 里 73 445 封 邮件 的 集合 。 

计算 TF*IDF 权 重要 做 的 第 一 件 事 就 是 把 感 兴趣 的 文档 分 解 成 词汇 序列 。 我 们 先 规定 词汇 是 
由 非 学 母 字 符 分 隅 的 字母 字符 串 ， 现 在 假设 在 某 个 文档 里 找到 了 “socket” 这 个 词 ， 它 是 否 重 要 
取决 于 上 下 文 。 需 要 分 析 大 量 文档 才能 评估 某 个 词 的 重要 性 。 

假设 单词 “socket” 在 1% 的 语料库 文档 里 出 现 。 要 计算 它 ， 可 以 分 析 语 料 库 里 的 所 有 文档 ， 
统计 有 多 少 文档 包含 这 个 词 。 

如 果 来 看 单独 的 文档 , 它 也 可 能 会 包含 单词 “socket”。 一 个 词 在 文档 里 出 现 的 次 数 除 以 文档 
的 总 词汇 数 被 称 为 这 个 词 的 词汇 频 度 。 因 此 ， 如 果 “socket” 在 某 个 文档 里 出 现 了 5 次 ， 而 该 文档 
共有 100 个 词 ， 那 么 该 词 的 词汇 频 度 就 是 5%。 如 果 “socket” 在 语料库 里 的 频 度 是 1%， 那 么 该 文 
档 的 5% 就 显得 非常 重要 ， 我 们 也 许 就 应 该 选择 “socket” 作 为 关联 文档 的 其 中 一 个 关键 词 。 如 果 
文档 的 词汇 频 度 是 1%， 那 么 就 和 父 语料库 的 出 现 概 率 相 同 ， 因 此 不 具有 重要 性 。 

某 个 词 在 文档 里 的 词汇 频 度 (TF ) 就 是 它 在 文档 里 出 现 的 次 数 除 以 文档 的 总 词汇 数 。 

单词 W 的 逆 文 档 频 度 (IDF ) 被 定义 为 Log (Tot/N+1)， 其 中 Tot 是 语料库 的 总 文档 数 ，N 是 包 












































GD http://en.wikipedia.org/wiki/Tf-idf 
@) http://en.wikipedia.org/wiki/Cosine similarity 
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含 单词 W 的 文档 数 。 

举 个 例子 , 假设 有 一 个 包含 1000 个 文档 的 语料库 。 如 果 “orange” 这 个 词 出 现在 25 个 文档 里 ， 
那么 它 的 IDF 就 是 Log(1000/26) (=1.58 )。 如 果 “orange” 在 一 个 100 个 词 的 文档 里 出 现 了 10 次 ， 
那么 它 的 TF 就 是 10/100 (= 0.1 )， 所 以 这 个 词 的 TF*IDF 权 重 是 0.158。 

为 了 寻找 某 个 文档 的 关键 词 集合 ， 我 们 会 计算 文档 里 每 个 词 的 TF*IDF 权 重 ， 然 后 采用 那些 
ee 被 忽略 。 

介绍 完 预 备 知 识 之 后 , 现在 可 以 来 计算 文档 里 的 哪些 词 算 是 好 关键 词 了 。 这 是 一 个 两 次 遍历 
人 第 一 次 遍历 会 计算 语料库 里 各 个 词 的 IDF， 第 二 次 遍历 会 计算 出 语料库 里 各 个 文档 的 关 
键 词 。 


27.4.2 ”余弦 相似 度 : 两 个 权重 向 量 的 相似 程度 


人 简单 的 示例 来 计算 两 个 给 定 关 键 词 品 量 的 余弦 相似 度 。 假 设 有 两 个 关键 词 呵 量 : K1 
i b 和 c; K2 包 含 关键 词 a、b 和 d。 这 些 关 键 词 和 它们 的 TF*IDF 权 重 如 下 . 
1> Kl = [{a,0.5},{b,0.1},{c,0.2}]. 
[{a,0.5},{b,0.1},{c,0.2}] 


2> K2 = [{a,0.3},1{b,0.2},{d,0.6}]. 
[4a,0.3},{b,0.2},1{d,0.6}] 


K1 和 K2 的 回 量 积 是 关键 词 相 同 项 的 权重 乘积 之 和 。 


3> Cross = 0.5*0.3 + 0.1*0 .2. 
0,16999999999999998 ， 


为 了 计算 余弦 相似 度 ， 我 们 把 癌 量 积 除 以 各 个 癌 量 的 范 数 ( norm )。 回 量 范 数 是 各 个 权重 平 
方 之 和 的 平方 根 。 

4> Norml = math:sqrt(0.5*0.5 + 0.1*0.1 + 0.2*0.2). 

OQ.5477225575051662 


Norm2 = math:sqrt(0.3*0.3 + 0.2*0.2 + 0.6*0.,6)., 
日 ,7 


余弦 相似 度 就 是 归 一 化 回 量 积 ANo 


5> Cross/(Norml*Norm2)}). 
0.4433944513137058 


它 已 被 编写 成 一 个 库 铺 数 。 


6> sherlock similar:cosine similarity(Kl, K2). 
OQ .4433944513137058 


两 个 关键 词 癌 量 的 余弦 相似 度 是 一 个 介 于 0 和 1 之 间 的 数字 。1 代 表 这 两 个 向 量 相同 , 0 代表 它 
们 之 无 相似 性 。 
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27.4.3 ”相似 度 查 询 


我 们 已 经 解释 了 相似 度 碍 询 的 所 有 预备 知识 。 首 先 计算 语料库 里 所 有 词 的 IDF， 人 然后 计算 请 
料 库 里 各 个 文档 的 关键 词 相 似 度 回 量 。 这 些 计算 可 能 会 伦 很 长 时 间 , 但 没有 关系 ,因为 它们 只 需 
要 做 一 次 。 

要 进行 相似 度 查 鹿 ， 我 们 会 取得 得 查询 文档 ， 并 用 语料库 的 IDF 计 算 它 的 关键 词 癌 量 。 然 后 
计算 语料库 里 每 个 文档 的 余弦 相似 度 ， 并 选择 那些 具有 最 大 余弦 相似 度 系数 的 值 。 

我 们 会 把 结 末 列 出 来 ,让 用 户 选 择 他 们 最 感 兴趣 的 文档 。 他 们 可 以 检查 这 些 文档 , 也 可 以 根 
据 之 前 的 分 析 结 末 进 一 步 搜 索 其 他 文档 。 


27.5 ”实现 方式 概览 


sherlock 的 所 有 代码 都 保存 在 本 书 主页 代码 库 " 的 code/sherlock 目 录 里 ,这 一 节 从 更 高 的 层 
面 概述 了 它 的 实现 方式 。 处 理 过 程 的 主要 阶段 如 下 。 

@ 初始 化 数据 存储 

sherlock mail:ensure mail root/V09 在 一 开始 就 被 调用 。 这 个 方法 能 确保 目录 
${HOME}/ .sherLock 存 在 。 我 们 将 把 所 有 数据 都 保存 在 名 为 ${HOME}/ .sherlock/mails 的 目录 
里 ， 在 下 文中 用 MAIL 来 指 代 它 。 

@ 获取 邮件 索引 

第 一 步 是 获取 http://erlang.org/pipermail/erlang-questions/ 上 的 数据 ， 这 是 通过 
inets 的 HTTP 客 户 端 完成 的 ， 它 是 Erlang 分 发 套装 的 一 部 分 。sherlock get mails: 
get index/1 负 责 获 取 邮 件 ，sherlock get mails:parse index/2 负 责 解 析 邮 件 。 从 服务 器 
取 回 的 HTML 文 件 被 保存 为 MAIL/questions.html， 解 析 结 果 则 保存 在 MAIL/questions 
.term 文 件 里 。 

@ 获取 原始 数据 

sherlock_mails:fetch all mails/0 负 责 获 取 所 有 邮件 。 它 一 开始 会 恋 取 MAIL/ 
questions .term， 人 然后 获取 所 有 压缩 后 的 邮件 文件 ， 并 把 它们 保存 在 MAIL/Vcache 目 录 里 。 

@ 给 数据 分 区 

sherlock mails:find mail years/V06 负 责 分析 邮 件 绥 存 里 的 文件 ， 然 后 返回 一 个 已 取 回 
邮件 的 年 份 列 表 。 

@ 处 理 给 定年 份 的 数据 

sherlock _mails:process year(Year) 会 做 三 件 事 : 解析 给 定年 份 的 所 有 数据 , 计算 那 一 
年 所 有 邮件 的 TF*IDF 权 重 ， 以 及 给 各 封 邮件 添加 合成 关键 词 。 

下 列 数 据 文件 会 被 创建 。 

口 MAIL/Year/parsed.bin 包 含 一 个 二 进 制 型 B， 而 binary to term(B) 是 一 个 由 #post 记 





























GD http://pragprog.conm/titles/jaerlang2/source code 
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录 组 成 的 列表 。 

口 MAIL/Year/idf.ets 是 一 个 保存 蔡 干 {Word,Index,Idf} 元 组 的 ETS 表 , 其 中 Word 是 一 个 
二 进 制 型 ( 邮件 里 的 某 个 词汇 ), Index 是 一 个 整数 索引 编号 , 而 Idf 是 该 词汇 的 IDF 权 重 。 

口 MAIL/Year/mails.bin 包 含 一 个 二 进 制 型 B, 而 binary to term(B) 是 一 个 由 #post 记 录 
组 成 的 列表 。 这 一 次 记录 里 被 加 上 了 合成 关键 词 。 

口 MAIL/Year/maits,List 是 一 个 包含 naiLs.bin 前 几 项 的 清单 , 开发 程序 时 会 用 到 它 。 偶 
尔 可 以 用 它 检 查 输 出 ， 看 看 结 采 是 否 符 合 预 期 。 

这 一 步 的 工作 会 分 几 处 完成 。sherlock tfidf.erl 负 责 计 算 TF*IDF 权 重 ，sherlock 
mails:parse maiLs/1L 负 责 解析 压缩 后 的 邮件 文件 ，text analyzers:standard analyzer 
factory/2 负 责 把 一 个 二 进 制 型 转换 成 词汇 列表 。 

@ 执行 相似 度 查询 

大 多 数 工 作 都 是 由 shertock mails:find mails similar to binary/2 完 成 的 。 它 负责 
读 取 MAIL/Year/idf.ets， 并 用 它 计算 二 进 制 型 的 关键 词 癌 量 (通过 调用 sherlock tfidf: 
keywords in binary/2 完 成 )。 随 后 ， 它 对 MAIL/Year/mails.bin 里 的 所 有 条 目 进 行 迭 代 ， 而 
每 一 个 条 目 都 包含 一 个 关键 词 向 量 。shertLock similar:cosine similarity/2 负 责 计 算 这 些 
关键 词 向 量 的 相似 度 ，shertock best .er1l 则 会 保存 一 个 包含 最 重要 邮件 的 列表 。 

@ 执行 单项 搜索 

sherlock mail:search mails regexp/4 人 负责 对 MAIL/Year/mails.bin 里 的 所 有 条 上 日 进 
行 迭 代 ， 并 对 #post 记 录 里 的 特定 元 系 执行 正则 表达 式 搜索 。 


27.6 ”练习 


sherlock 的 后 续 开 发 会 在 GitHub 里 进行 "。 如 果 能 提供 下 列 任何 问题 的 解决 方案 , 请 创建 一 个 
sherlock 分 支 ， 然 后 给 我 发 送 一 个 拉 ( pull ) 请 求 。 正 如 你 在 这 个 清单 里 所 见 ，sherlock 程 序 有 不 
少 可 以 改进 的 地 方 ， 还 有 很 多 事 可 以 做 。 

1. 找 出 模块 的 相似 度 

sherlock 能 找 出 Erlang 邮 件 列表 里 各 个 邮件 之 间 的 相似 度 。 添 加 一 种 功能 来 比较 某 个 大 型 
Erlang 模 块 集合 的 相似 度 。 

2. 找 出 模块 历史 

除了 定义 模块 之 间 的 相似 度 , 还 可 以 定义 两 个 模块 之 间 的 距离 。 找 到 一 组 相似 模块 之 后 ,请 
试 着 追溯 模块 的 历史 。 这 些 模块 是 否 是 通过 相互 剪 切 粘贴 代码 派生 出 来 的 ? 如 果 找 到 了 一 组 相似 
模块 ， 能 和 否 追 溯 到 它们 的 共同 祖先 ? 

3. 分 析 其 他 邮件 列表 的 数据 

sherlock 只 能 提取 来 自 pipermail 存 档 的 数据 。 编 写 一 些 能 从 其 他 常用 邮件 列表 或 论坛 程序 里 
提取 邮件 的 代码 。 





















































GD https://github.com/joearms/sherlock 


4. Beautiful Soup 

Python 里 有 一 个 名 为 Beautiful Soup 的 程序 ， 它 可 以 用 来 编写 屏幕 抓 取 器 (screen-scraper )。 
实现 一 个 Erlang 版 的 Beautiful Soup， 用 它 来 收集 某 些 流行 邮件 列表 里 的 邮件 。 

5. 改进 文本 分 析 

改进 文本 分 析 需 ， 看 一 看 它 生 成 的 词汇 。 给 Erlang 编 写 一 些 日 定义 词汇 生成 天， 用 它们 提取 
不 同类 型 文件 里 的 文本 。 

6. 单项 搜索 

给 数据 谎 加 额外 的 字段 并 改进 单项 搜索 。 

7. 制作 一 个 Web 界 面 

给 sherlock 制 作 一 个 Web 界 面 。 

8. 给 邮件 打分 

类 试 给 邮件 打分 ， 打 分 标准 可 以 是 准 写 了 邮件 ， 谁 评论 了 邮件 ， 以 及 邮件 产生 了 多 少 回复 。 

9. 制作 结果 图 表 

给 东 次 查询 计算 出 的 相似 度 关 系 制作 图 表 。 在 浏览 可 里 展示 这 些 图 形 。 

10. 把 邮件 集 转换 成 电子 书 

用 epub 格 式 生 成 。 











27.7 总 结 


感谢 你 阅读 本 书 ， 希望 你 能 喜欢 它 。 这 是 一 段 洲 长 的 旅程 ， 你 学 到 了 很 多 新 东西 。Erlang 的 
世界 观 与 其 他 编程 语言 很 不 一 样 ， 最 大 的 区 别 在 于 如 何人 处 理 错 误 以 及 如 何 实 现 并 发 。 

并 发 是 Erlang 的 本 能 。 现 实 世 界 里 的 确 存在 通过 消息 交流 的 事物 。 我 以 前 是 一 名 物理 学 家 ， 
通过 接收 消息 来 感知 世界 。 每 一 段 光 和 声音 都 承载 着 信息 。 我 们 对 世界 的 全 部 认识 都 来 利于 接收 
到 的 消息 。 

我 们 没有 共享 的 记忆 。 我 有 我 的 记忆 ， 你 有 你 的 记忆 ,我 不 知道 你 在 想 些 什 么 。 如 果 我 想 知 
道 你 的 想法 ， 丈 必须 问 你 一 个 问题 并 等 竺 答复。 

Erlang 使 用 的 编程 模型 和 这 个 世界 的 运作 方式 非常 相似 。 这 让 编程 变 得 简单 。 许 多 程序 员 发 
现 了 这 一 点 ， 许 多 公司 也 是 。 

那么 ， 接 下 来 该 做 什么 ? 把 Erlang 告 诉 别 人 ， 加 入 Erlang 邮 件 列 表 ， 参 加 世界 各 地 举办 的 
Erlang 会 议 ， 解决 一 些 有 意思 的 问题 ， 并 且 动 手 让 世界 变 得 更 美好 。 
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OTP 模 板 








本 附录 包含 gen serverand、supervisor 和 application 的 完整 模板 清单 。 这 些 模板 内 建 
于 Emacs 模 式 。 


A.1 通用 服务 器 模板 


gen_server_template.full 


%% @ 作 者 XXX<medGQhostname ,LocaL> 
%%% @ 版 权 所 有 (C) 2013，XXX 
@Qdoc 


GQend 
创建 于 : 2013 年 5 月 26 日 作者 XXX <me@hostname.local> 


-behaviour(gen server). 


%% API 
-export([start link/0]). 


%% gen SeErVver 回 调子 数 
-export([init/1, handle call/3, handle cast/2, handle info/2, 
terminate/2, code change/3]). 


-define(SERVER, ?MODULE ) . 


-record(state, {}). 


=: 
%%%5 API 
人 
TT 
%% @Qdoc 

%% 启动 服务 器 


附录 A OTP 模板 


% @spec start link() -> {ok, Pid} | ignore | {error, Error} 
% Gend 


start link() -> 
gen server:start link({local, ?SERVER}, ?MODULE, [], [1). 


%%% gen SeErVver 回 调 涵 数 

0% =—==== 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 = 二 二 = 二 = 二 = 二 = 二 ===================== 二 = 二 二 = 
0 070=—== 
区 9 
[ee 

%% @private 

%% @doc 

%% 初始 化 服务 器 


%% 

%% @spec init(Args) -> {ok, State} | 

%% {ok, State, Timeout} | 
%% ignore | 
2<2- 
OO 
2<2< 
OO 
099 

oO 


{Stop, Reason} 


init([]) -> 


% @private 

% @doc 

% 处 理 调 用 消息 

% @spec handle call(Request, From, State) -> 

% {reply, Reply, State} | 

% {reply, Reply, State, Timeout} | 
% {noreply, State} | 

% {noreply, State, Timeout} | 

% {stop, Reason, Reply, State} | 

% {Stop, Reason, State} 


andle call( Request, From, State) -> 
Reply = ok, 
{reply, Reply, State}. 


%% @private 

%% @Qdoc 

%% 处 理 播发 消息 

% @spec handle cast(Msg, State) -> {noreply, State} | 

% {noreply, State, Timeout} | 
% {Stop, Reason, State} 
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handle cast( Msg, State) -> 
{noreply, State}. 


%% @private 

%% doc 

%% 处 理 所 有 非 调用 /播发 的 消息 

%% @spec handle info(Info, State) -> {noreply, State} | 

%% {noreply, State, Timeout} | 
%% {stop, Reason, State} 

%% Gend 

handle info( Info, State) -> 


{noreply, State}. 


te 
%% @private 

%% @Qdoc 

%% 这 个 防 数 是 在 某 个 gen _server 即 将 终止 时 调用 的 。 它 应 当 是 Module:init/1 的 北 操 作 ， 并 进行 必要 的 清理 。 


%% 当 它 返回 时 ，gen Server 终 止 并 生成 原因 Reason。 它 的 返回 值 会 被 忽略 


% @spec terminate(Reason, State) -> void() 
% Gend 


ok. 
%% @private 
%% @doc 
%% 在 代码 更 改 时 转换 进程 状态 


% @spec code change(0Ldvsn，9tate，Extra) -> {ok, NewState} 
% @end 


code change( OldVsn, State, Extra) -> 
{ok, State}. 


CQD-C- 一 一 一 一 一 一 一 一 
OO-O-o 立 

-6656 内 部 东 数 
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%% @ 作 者 XXX <me@Ghostname. local> 
%%5% @ 版 权 所 有 (C) 2013 ，XXX 
%%% doc 
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[®) [e) 
6366 
%%% Gend 
O 〇 (©) 
“626 


创建 于 2013 年 5 月 26 日 作者 XXX <me@hostname.local> 


-behaviour (supervisor). 
%% API 
-export([start link/0]). 


%% 监控 器 回调 隙 数 
-export([init/1]). 


-define(SERVER, ?MODULE). 


GQend 


start link() -> 
supervisor:start link({local, ?SERVER}, ?MODULE, [|]). 


09 == 一 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 = 二 = 二 二 二 = 二 == 二 == 一 二 = 一 = 一 一 一 = 一 = 二 
0°00— 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 = 

%%% 监控 器 回调 池 数 

009 一 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 = 二 = 二 二 二 二 二 二 二 == 一 = 一 一 = 一 = 一 一 = 一 = 

和 全 全 且 一 人 

.00 0 0 

[© I © A 

%% @private 

%% @Qdoc 

%% 每 当 Supervisor:start Link/[2,3] 启 动 一 个 监控 器 时 ， 新 进程 就 会 调用 这 个 函数 来 确定 重启 策略 、 


%5 最 大 重启 频率 和 子 进程 规范 
specifications. 


%% @spec init(Args) -> {ok, {SupFlags, [ChildSpec]}} | 
%% ignore | 

%% {error, Reason} 

%% GQGend 


jnit([]) -> 
RestartStrategy = one for one, 
MaxRestarts = 1000, 
MaxSecondsBetweenRestarts = 3600, 


SupFlags = {RestartStrategy, MaxRestarts, MaxSecondsBetweenRestarts}, 


Restart = permanent, 
Shutdown = 2000, 
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Type = worker， 


AChild = {'AName', {'AModule', start link, []}, 
Restart, Shutdown, Type, ['AModule']}, 


{ok, {SupFlags, [AChild]}}. 


2 ,EPSP EE EEE Ee EE Sa SI OE CS OI Se OE ESI OES SECIS ESOR SE OTS Oy ETO OO et es Sm ne YE OE OE EE EE EE 
二 
O_O_O 立 

%%% 内 部 函数 

EE OE EEC 
二 和 二 二 二 essssesssesssssseeseseesessssesesesss 


A.3 应 用 程序 模板 


application_template.full 


%% @ 作 者 XXX <meGhostname ,LocalL> 
%%% @ 版 权 所 有 (C) 2013 ，XXX 
@Qdoc 


GQend 
创建 于 : 2013 年 5 月 26 日 作者 XXX <me@hostname.local> 


-behaviour(application). 


%% 应 用 程序 回调 济 数 
-export([start/2, stop/1]). 


ee 
%%% 应 用 程序 回调 函数 
%%%=================================================================== 
Se 

%% @private 

%% doc 

%% 用 appLication:start/[1,2] 启 动 一 个 应 用 程序 时 会 调用 这 个 函数 。 它 应 当局 动 该 应 用 程序 的 各 个 进程 。 


%% 如 果 应 用 程序 的 结构 遵循 OTP 的 监控 树 设 计 原 则 ， 此 函数 就 会 司 动 该 树 的 项 级 监控 进程 。 


%% @spec Start(S9tartType，9tartArgs) -> {ok, Pid} | 

%% {ok, Pid, State} | 

%% {error, Reason} 

%% StartType = normal | {takeover, Node} | {failover, Node} 
%% StartArgs = term() 

%% Gend 


start( 9tartType， StartArgs) -> 
case 'TopSupervisor':start link() of 
{ok, Pid} -> 
{ok, Pid},; 
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Error -> 
Error 
end 
%%-------------------------------------------------------------------- 
%% @private 
%% doc 
%% 这 个 吕 数 是 在 应 用 程序 停止 时 调用 的 。 它 应 当 是 Module:start/2 的 逆 操 作 ， 并 进行 必要 的 清理 。 它 的 返回 


%% 值 会 被 忽略 。 


%% @spec stop(State) -> void() 
%% Qend 





一 个 套 接 字 应 用 程序 








本 附录 是 关于 实现 Lib chan 库 的 ， 我 们 在 14.6.1 节 里 介绍 过 它 。Lib chan 的 代码 在 TCP/IP 
之 上 实现 了 一 个 完整 的 网 络 层 , 能 够 提供 认证 和 Erlang 数 据 流 功能 .一 旦 理解 了 Lib chan 的 原理 ， 
就 能 量 身 定制 我 们 自己 的 通信 基础 结构 ， 并 把 它 革 加 在 TCP/IP 之 上 了 。 

就 Lib_chan 本 二 而 言 ， 它 是 一 种 构建 分 布 式 系统 的 有 用 组 件 。 

为 了 保持 本 附录 的 完整 性 ， 以 下 内 容 会 与 14.6.1 节 里 的 材料 出 现 部 分 重复 。 

本 附录 里 的 代码 是 我 介绍 过 的 最 复杂 的 代码 之 一 ， 所 以 如 果 第 一 次 阅读 时 不 能 理解 也 别 担 
心 。 如果 你 只 想 使 用 Lib_chan 而 不 关心 它 是 如 何 实现 的 , 阅读 第 一 和 就 够 了 , 其 余部 分 可 以 跳 过 。 











B.1 一 个 示例 


首先 ， 用 一 个 简单 的 示例 来 展示 如 何 使 用 Lib chan。 我 们 会 创建 一 个 简单 的 服务 器 ， 让 它 
计算 阶乘 和 斐 波 那 契 数 ， 并 用 一 个 密码 来 保护 它 。 

这 个 服务 器 将 在 2233 端 口 工作 。 

创建 服务 妖 的 过 程 共 分 四 步 。 

(1) 编写 配置 文件 。 

(2) 编写 服务 融 代 码 。 

(3) 启动 服务 器 。 

(4) 通过 网 络 访问 服务 器 。 


B.1.1 步骤 1: 编写 配置 文件 
以 下 是 这 个 示例 的 配置 文件 : 
socket_dist/config]1 


{port, 2233}. 
{service, math, password, "qwerty", mfa, mod math, run, []}. 


这 个 配置 文件 里 有 一 些 service 元 组 ， 它 们 的 形式 如 下 . 


{service, <Name>, password, <P>, mfa, <Mod>, <Func>, <ArgList>} 
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里 面 的 参数 由 原子 service、password 和 mfa 分 隔 。mfa 是 “module, function, args” 的 缩写 ， 
意思 是 接 下 来 的 三 个 参数 应 当 被 解释 为 模块 名 、 吨 数 名 和 一 个 用 来 调用 哺 数 的 参数 列表 。 

在 我 们 的 示例 里 ， 配 置 文 件 指定 了 一 个 名 为 math ( 数学 ) 的 服务 ， 它 的 工作 端口 是 2233。 这 
个 服务 由 密码 qwerty 保护 ， 实 现 它 的 模块 名 为 nod_math， 启 动 方 式 是 调用 mod_math: run/3， 
run/3 的 第 三 个 参数 是 []。 

















B.1.2 步 又 2: 编写 服务 器 代码 
这 个 数学 服务 带 的 代码 如 下 : 


socket dist/mod math.erl 


-module{mod math). 
-export( [run/3]}). 
run{MM, ArgC, ArgS) -> 
io:format("mod math:run starting~n" 
"ArgC = ~p ArgS=~p~n", [ArgC, ArgSs]), 
loop (MM)., 
loop(MM) -> 
receive 
{chan, MM, {factorial, N}} -> 
MM ! {send, fac{(N)}, 
Loop (MM),; 
{chan, MM, {fibonacci, N}} -> 
MM ! {send, fib{N)})}, 
Loop (MM):; 
{chan closed, MM} -> 
io:format("mod math stopping~n"), 


exit (normal) 
end. 
fac(0) -> 1,; 
fac{N) -> N*fac(N-1). 
fib(1i) -> 1; 
fib{(2) -> 1; 
fib(N) -> fib(N-1) + fib(N-2). 


当 某 个 客户 端 连接 到 2233 端 口 并 请 求 math 服 务 时 ，1ib_auth 会 对 它 进 行 认证 ， 如 果 密 码 正 
硝 ， 就 会 通过 mod_math: run(MM，ArgC，Arg5S) 函数 分 裂 出 一 个 处 理 进 程 。MM 是 中 间 人 的 PID， 
Arg(C 来 目 客 户 端 ，ArgS 则 来 目 配置 文件 。 

如 果 客 户 端 向 服务 器 发 送 一 个 消息 X， 到 达 后 就 会 转换 成 消息 {chan，MM，X}j。 如 果 客 户 端 
挂 了 或 者 连接 出 现 问题 ,服务 硕 就 会 收 到 一 个 {chan_cLosed，MM} 消 息 。 要 回 客 户 端 发 送 消息 Y， 
服务 此 需要 执行 MM ! {send，Y}， 要 关闭 通信 信道 就 执行 MM ! close。 

这 个 数学 服务 硕 很 简单 ， 它 所 做 的 就 是 等 待 一 个 {chan，MM，{factoriaL，N}} 消 县 ， 然 
后 执行 MM ! fsend，fac(N)} 来 把 结 末 发 回 客户 端 。 
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B.1.3 步骤 3: 启动 服务 器 
像 下 面 这 样 局 动 服务 融 : 


1> 1ib chan:start server("./conf1g1'" ) . 


ConfijgData=[{port,2233}, {service,math,password, "qwerty",mfa,mod math,run,{[]}] 
true 


B.1.4 步骤 4: 通过 网 络 访问 服务 器 
可 以 在 单 台 机 器 上 进行 代码 测试 。 


2> {ok, S} = Lib chan:connect("LocaLhost" ,2233 ,math ， 
"qwerty", {yes,9g0})., 





{ok,<0.47.0>} 

3> lib chan:rpc(S, {factorial,20}). 
2432902008176640000 

4> Lib chan:rpc(S, {fibonacci,15}). 
610 

4> lib chan:disconnect(S). 

close 


B.2 Lib chan 是 如 何 工 作 的 


构建 Lib_chan 使 用 了 四 个 模块 里 的 代码 。 

D Lib_chan 扮 演 “ 主 模块 ”的 角色 。 程 序 员 只 需要 了 解 Lib_chan 所 导出 的 那些 方法 。 其 他 
三 个 模块 〈 稍 后 讨论 ) 会 在 Lib_chan 的 内 部 使 用 。 

D Lib chan_mm 负 责编 码 和 解码 Erlang 消 息 ， 并 管理 套 接 字 通信 。 

D Lib_chan_cs 负 责 设立 服务 需 并 管理 客户 端 连 接 。 它 的 主要 工作 之 一 是 限制 同时 连接 的 
最 大 客户 端 数量 。 

口 Lib_chan_auth 包 含 的 代码 用 于 进行 简单 的 质询 / 啊 应 认证 。 














B.2.1 Lib chan 
Lib_chan 的 结构 如 下 。 


-module(lib chan). 


start server(ConfigFile) -> 

%% 读 取 配置 文件 并 检查 语法 
% 调用 start port server(Port, ConfigData) 
% ' 其 中 Port 是 所 需 的 韶 口 ，ConfigData 包 含 配 置 数据 


oo 


oo 
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start port server(Port, ConfigData) -> 
lib chan cs:start raw server( .. 
fun(Socket) -> 
start port instance(Socket, ConfigData), 
end, ...) 
%% Lib chan cs 负责 管理 连接 。 
%% 新 连接 建立 后 会 调用 start raw server 的 参数 ， 
a 也 就 是 这 个 fun。 
art port instance(Socket, ConfigData) -> 
它 会 在 客户 一 连接 服务 器 时 执行 分 裂 。 
%% 我 们 会 设立 一 个 中 间 人 并 执行 认证 ， 
如 果 一 切 顺利 就 调用 
%% really start(MM, ArgC, {Mod, Func, ArgS}) 
%% (后 三 个 参数 来 自 配置 文件 ) 


really start(MM, ArgC, {Mod, Func, ArgSs}) -> 
apply(Mod, Func, [MM, ArgC, ArgS]). 


connect (Host, Port, Service, Password, ArgC) -> 
S%%% 客 尸 疡 代码 


B.2.2 Lib chan mm: 中间人 














Lib_chan_mm 实 现 了 一 个 中 间 人 。 它 能 对 应 用 程序 隐藏 套 接 字 通信 , 并 把 TCP 套 接 字 上 的 数 
据 流 转变 成 Erlang 消 息 。 中 间 人 负责 组 装 消 息 (〈 它 可 能 是 碎片 化 的 ) 和 编码 /解码 Erlang 数 据 类 型 ， 
也 就 是 把 它们 转换 成 能 通过 套 接 字 发 送 和 接收 的 字 和 流 。 
现在 是 看 一 下 图 B-1 的 好 时 机 ， 它 展示 了 我 们 的 中 间 人 架构 。 当 M1 机 器 上 的 P1 进 程 想 给 M2 机 
硕 上 的 P2 进 程 发 送 消 息 T 时 ， 它 就 会 执行 MM1 ! {fsend，T}。MM1 扮 沉 P2 的 代理 角色 。 任 何 发 给 
MM1 的 消息 都 会 被 编码 、 写 人 套 接 字 ， 然 后 发 给 MM2 。MM2 会 解码 从 套 接 字 收 到 的 所 有 数据 ， 然 后 
把 消息 {chan，MM2，T} 发 给 P2。 





























图 B-1 带 中 间 人 的 套 接 字 通信 


M1 机 器 上 的 MM1 进 程 表现 得 就 像 是 P2 的 代理 ， 而 在 M2 机 器 上 的 MM2 进 程 表现 得 就 像 是 P1 的 
代理 。 
MM1 和 MM2 都 是 中 间 人 进程 的 PID。 中 间 人 进程 的 代码 如 下 。 
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loop(Socket, Pid) -> 
receive 
{tcp, Socket, Bin} -> 
Pid ! {chan, self(), binary to term(Bin)}, 
loop(Socket, Pid); 
{tcp closed, Socket} -> 
Pid ! {chan closed, self()}; 
CLDSe -> 
gen tcp:close(Socket); 
{send, T} -> 
gen tcp:send(Socket, [term to binary(T)]), 
loop(Socket, Pid) 
end, 


这 个 循环 是 套 接 字 数据 和 Erlang 消 息 传 输 这 两 个 世界 之 间 的 接口 。 稍 后 〈《 人 参阅 B.3.3 蔬 ) 你 会 
看 到 Lib_chan_mm 的 完整 代码 , 它 比 这 里 展示 的 代码 略微 复杂 一 些 ， 但 原理 是 相同 的 。 唯 一 的 区 
别 是 沃 加 了 跟踪 消息 的 代码 和 一 些 接口 方法 。 














B.2.3 lib chan cs 
Lib_ chan_ cs 负责 设立 客户 端 和 服务 顺 通 信 。 下 面 是 它 导 出 的 两 个 重要 方法 。 





@ start raw server(Port, Max, Fun, PacketLength) 
它 会 局 动 一 个 监听 融 来 监听 Port 上 的 连接 。 人 允许 的 最 大 同时 会 话 数 是 Max。Fun 是 一 个 元 数 
为 1 的 ftn，Fun(Socket ) 会 在 连接 开始 时 执行 。 套 接 字 通信 会 假定 包 长 度 为 PacketLength。 











@ start:raw client(Host, Port, PacketLength) => {ok, Socket} | {error, Why} 
它 会 笑 试 连接 由 start_raw_server 打 开 的 端口 。 


Llib_chan_cs 的 代码 避 循 17.1.3 市 里 描述 的 模式 ， 此 外 它 还 限制 同时 打开 的 最 大 连接 数 。 叶 
然 这 个 小 细 广 从 概念 上 讲 十 分 简单 ,但 它 需 要 增加 20 行 左右 的 星 涩 代码 来 执行 捕捉 退出 之 类 的 任 
务 。 这 样 的 代码 看 上 去 一 团 糟 , 但 是 不 必 担 心 ， 它 能 很 好 地 完成 自己 的 工作 ,并 对 模块 的 用 户 隐 
藏 其 中 的 复杂 性 。 




















B.2.4 Lib chan auth 


这 个 模块 实现 了 一 种 简单 形式 的 质询 /响应 认证 。 质 询 /响应 认证 基于 “关联 服务 名 的 共享 秘 
窗 ” 这 一 概念 。 要 展示 它 是 如 何 工 作 的 ， 我 们 将 假设 一 个 名 为 math 的 服务 具有 qwerty 这 个 共 至 
秘密 。 

如 果 某 个 客户 端 想 使 用 math 服 务 , 就 必须 回 服 务 器 证 明 它 知道 共享 秘密 。 这 个 过 程 如 下 所 示 。 

(1) 客户 端 癌 服务 器 发 送 一 个 请 求 来 表示 它 和 希望 使 用 math 服 务 。 

(2) 服务 春 计 算出 一 个 随机 字符 串 C， 然 后 把 它 发 给 客户 问 。 这 就 是 质询 。 字 符 串 是 由 
lib_chan auth:make_challenge() 抑 数 生 成 的 。 可 以 用 交互 方式 来 看 它 是 如 何 工作 的 。 
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1> C = lib chan auth:make chaLtenge( ) . 
"qnyrgzqefvnjdombanrsmxikc" 


(3) 客户 端 接收 字符 串 (C ) 并 计算 出 响应 (R )， 其 中 R = MD5(C ++ Secret)， 它 是 由 
Lib chan auth:make response 生 成 的 。 这 里 有 一 个 例子 : 


2> R = Lib chan auth:make response(C, "qwerty"). 
"e759ef3778228beae988d91a67253873" 


(4) 这 个 啊 应 被 发 回 服务 磊 。 服 务 侣 接收 啊 应 并 检查 它 是 否 正 确 , 做 法 是 算出 预期 的 啊 应 值 。 


这 是 由 Lib chan auth:is response correct 实 现 的 。 





3> lib chan auth:is response correct(C, R, "qwerty"). 
true 


B.3 Lib chan 代 码 
是 时 候 来 看 看 代码 了 。 
B.3.1 Lib chan 


socket dist/lib_chan.erl 


-module(lib chan). 

-export([cast/2, start server/0, start server/l, 
connect/5, disconnect/1, rpc/21). 

-import(lists, [map/2, member/2, foreach/21). 

-import(lib chan mm, [send/2, close/1]). 


start server() -> 
case 0s:getenv ("HOME") of 
false -> 
exit({ebadEnv, "HOME"}); 
Home -> 
start server(Home ++ "/.erlang config/tib chan.conf'") 
end. 


start server(ConfigFile) -> 
io:format ("lib chan starting:~p~n",[ConfigFilel]), 
case file:consult(ConfigFile) of 
{ok, ConfigData} -> 
jo:format ("ConfigDatea=~p~n", [ConfigDatal]), 
case check terms(ConfigData) of 
[] -> 
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start_ serverl(ConfigData), 
Errors -> 
exit({eDaemonConfig, Errors}) 
end; 
{terror, Why} -> 
exit({eDaemonConfig, Why}) 
end. 


%% Check terms() -> [Error] 
check terms(ConfigData) -> 

L = map(fun check term/1, ConfigData), 

[X || {error, XxX} <- L]. 
check term({port, P}) when is integer(P) -> Ok; 
check term({service, ,password, ,mfa, , , }) -> ok; 
check term(X) -> {error, {badTerm, X}}. 


start serverl(ConfigData) -> 
register (lib chan, spawn(fun() -> start server2(ConfigData) end)). 


start server2(ConfigData) -> 
[Port] = [ P || {port,P} <- ConfigData], 
start port server(Port, ConfigData). 


start port server(Port, ConfigData) -> 
lib chan cs:start raw server(Port， 
fun(Socket) -> 
start port instance(Socket, 
ConfigData) end, 
100 ， 
4) ， 


start port jnstance(Socket, ConfigData) -> 
%% 这 是 处 理 底 层 连 接 的 位 置 
%% 但 首先 要 分 裂 出 一 个 连接 处 理 进程 ， 必 须 成 为 中 间 人 


Ss = self(), 
Controller = Spawn link(fun() -> start erl port server(S, ConfigData) end), 
lib chan mm:loop(Socket, Controller). 


start erl port server(MM, ConfigData) -> 
receive 
{chan, MM, {startService, Mod, ArgC}} -> 
case get service definition(Mod, ConfigData) of 
{yes, Pwd, MFA} -> 
case Pwd of 
none -> 
send(MM, ack), 
really start(MM, ArgC, MFA); 


-> 
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do authentication(Pwd, MM, ArgC, MFA) 
end ; 
no -> 
io:format("sending bad service~n"), 
send(MM, badService), 
close (MM) 
end ; 
Any -> 
io:format("*** EL port server got:~p ~p~n", [MM, Any]), 
exit({protocolViolation, Any}) 
end. 
do authentication(Pwd, MM, ArgC, MFA) -> 
C = Lib chan auth:make challenge(), 
send(MM, {challenge, C}), 
receive 
{chan, MM, {response, R}} -> 
case lib chan auth:is response correct(C, R, Pwd) of 
true -> 
send (MM, ack), 
really start(MM, ArgC, MFA); 


false -> 
send (MM, authFail), 
close (MM) 
end 
end. 
%% MM 是 中 间 人 
%% Mod 是 我 们 想 要 执行 的 模块 。ArgC 和 Arg5 分 别 来 自 客户 端 和 服务 器 


really_start(MM, ArgC, {Mod, Func, ArgS}) -> 
%% 认证 成 功 ， 现 在 开始 工作 
case (catch appLy(Mod,Func, [MM,ArgC,ArgS])) of 
{'EXIT', normal} -> 
true,; 
{'EXIT', Why} -> 
io:format("server error:~p~n", [Why]); 
Why -> 
ijo:format("server error should die with exit(normal) was:~p~n", 
[Why ] ) 
end. 


%5% get service definition(Name, ConfigData) 


get service definition(Mod, [{service, Mod, password, Pwd, mfa, M, F, A}|_]) -> 
{yes, Pwd, {M, F, A}}; 

get service definition(Name, [_|T]) -> 
get service definition(Name, T); 

get service definition( ，[]) -> 
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No. 


%% 客户 痹 连接 代码 
%% Connect(...) -> Tok, MM} | Error 


connect(Host, Port, Service, Secret, ArgC) -> 


S = self(), 
MM = spawn (fun() -> connect(S$, Host, Port) end), 
receive 
{MM, ok} -> 
case authenticate(MM, Service, Secret, ArgC) of 
ok -> {ok, MM}; 
Error -> Error 
end; 
{MM, Error} -> 
Error 
end. 


connect(Parent, Host, Port) -> 
case lib chan cs:start raw client(Host, Port, 4) of 
{ok, Socket} -> 
Parent ! {self(), ok}, 
lib chan mm:loop(Socket, Parent); 
Error -> 
Parent ! {self(), Error} 
end. 


authenticate (MM, Service, Secret, ArgC) -> 
send(MM, {startService, Service, ArgC}), 
%% 应 该 会 收 到 质询 、aCk 或 者 套 接 字 已 关闭 的 消息 
receive 
{chan, MM, ack} -> 
Ook; 
{chan, MM, {challenge, C}} -> 
R = lib chan auth:make response(C, Secret), 
send(MM, {response, R}), 
receive 
{chan, MM, ack} -> 
OK ; 
{chan, MM, authFail} -> 
wait close(MM), 
{error, authFail}; 
Other -> 
{error, Other} 
end; 
{chan, MM, badService} -> 
walit close (MM), 
{error, badService}, 
Other -> 
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{error, Other} 
end ， 


wait close(MM) -> 
receive 
{chan closed, MM} -> 

true 

after 5000 -> 
io:format("**error Llib chan~n"), 
true 

end., 


disconnect(MM) -> close(MM). 


roc(MM, Q) -> 
send(MM, Q), 
recelive 
{chan, MM, Reply} -> 
Reply 
end. 


cast(MM, Q) -> 
send(MM, Q). 


B.3.2 lib chan cs 


socket _dist/lib_chan_cs.erl 

-module(lib chan cs). 

%% CS 代表 Client server 
-export([start raw server/4, start raw client/3]1). 
-export([stop/1]). 

-export([children/1]). 


%% start raw server(Port, Fun, Max, PacketLength) 

%% 这 个 服务 器 在 Port 上 接受 最 多 MaX 个 连接 

S%%% 首次 连接 Port 时 ,会 调用 Fun (Socket) 

%% 此 后 发 给 套 接 字 的 消息 会 转换 成 发 给 处 理 进程 的 消息 

s% PacketLength 通 常 是 0、1、2 或 4 (详情 见 jnet 的 手册 页 ) ) 


%% tcp_server 的 典型 用 法 如 下 [1]: 
%% 设立 一 个 监听 器 


%% start agent (Port) -> 


%% process flag{trap exit, true), 

%% Llib_chan_server:start raw_ server{Port, 

%% fun(Socket)} -> input handler(Socket) end, 
Ge 15, 0). 


start raw client(Host, Port, PacketLength) -> 
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gen tcp:connect(Host, Port, 

[binary, {active, true}, {packet, PacketLength}]}). 
% 注意 : 当 Start raw server 返 回 时 
% 它 应 该 已 经 准备 好 立即 接受 请 求 了 


oP 


oD 


start raw_ server(Port, Fun, Max, PacketLength) -> 
Name = port name (Port), 
case whereis (Name) of 
undefined -> 
Self = self(), 
Pid = spawn link(fun() -> 
cold start{Self,Port,Fun,Max,PacketLength) 
end ) ， 
receive 
{Pid, ok} -> 
register (Name, Pid), 
{ok, self()}; 
{Pid, Error} -> 
Error 
end; 
_Pid -> 
{error, already started} 
end. 


stop(Port) when integer(Port) -> 
Name = port name (Port), 
case whereis (Name) of 
undefined -> 
not started; 
Pid -> 
exit(Pid, kill), 
(catch unregister (Name)), 
stopped 
end., 
children(Port) when integer(Port) -> 
port name(Port) ! {children, self()}, 
receive 
{session server, Reply} -> Reply 
end., 


port name(Port) when integer(Port) -> 
list to atom("portServer" ++ integer to list(Port)). 


cold start(Master, Port, Fun, Max, PacketLength) -> 
process flag(trap exit, true), 
%% 现在 我 们 准备 好 运行 了 
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case gen tcp:listen(Port, [binary, 
%% {dontroute, true}, 
{nodelay, true}, 
{packet, PacketLength}, 
{reuseaddr, true}, 
{active, true}]) of 
{ok, Listen} -> 
%% io:format("Listening to:~p~n", [Listen]), 
Master ! {self()}, ok}, 
New = start accept(Listen, Fun), 
%% Now we re ready to run 
socket loop(Listen, New, [], Fun, Max),; 
Error -> 
Master ! {self(), Error} 
end. 


socket loop(Listen, New, Active, Fun, Max) -> 
receive 
{istarted, New} -> 
Activel = [New|Activel], 
possibly start another(false,Listen,Activel,Fun,Max),; 
{'EXIT', New, Why} -> 
%% Io:format("Child exit=~p~n", [Why]), 
possibly start another(false,Listen,Active,Fun,Max),; 
{'EXIT', Pid, Why} -> 
%% Io:format("Child exit=~p~n", [Why]}), 
Activel = lists:delete(Pid, Active), 
possibly start another(New,Listen,Activel,Fun,Max); 
{children, From} -> 
From ! {session server, Active}, 
socket loop(Listen,New,Active,Fun,Max),; 
_Other -> 
socket loop(Listen,New,Active,Fun,Max) 
end. 


possibly start another(New, Listen, Active, Fun, Max) 
when pid(New) -> 
socket loop(Listen, New, Active, Fun, Max); 
possibly start another(false, Listen, Active, Fun, Max) -> 
case length(Active) of 
N when N < Max -> 
New = start accept(Listen, Fun), 
socket loop(Listen, New, Active, Fun,Max); 
-之 
socket loop(Listen, false, Active, Fun, Max) 


end. 


start accept(Listen, Fun) -> 
5 = self(), 
spawn link(fun() -> start_chiLd(S，Listen，Fun) end ) ， 
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start child(Parent, Listen, Fun) -> 
case gen tcp:accept(Listen) of 
{ok, Socket} -> 


Parent ! {istarted,self()}, % 告知 控制 器 
lnet:setopts(Socket, [{packet,4}, 
binary, 


{nodelay,true}, 
{active, true}]), 
5%% 激活 套 接 字 之 前 
%% Io:format("running the child:~p Fun=~p~n", [Socket, Fun]j), 
process flag(trap exit, true), 
case (catch Fun(Socket)) of 
{1'EXIT', normal} -> 
true; 
{'EXIT', Why} -> 
io:format ("Port process dies with exit:~p~n", [Why]), 
true; 


%%6 不 是 退出 消息 ， 说 明 一 切 顺利 
t 


end 
end . 


B.3.3 Lib chan mm 


socket dist/lib chan mm.erl 
和 协议 
发 往 控 制 进 程 
{chan, MM, Term} 
{tchan closed, MM} 
来 自任 意 进程 
{send, Term} 
CLlose 


oo oo oo oo oo0 oo 
oo oP oo oP oo 


oo 
oo 


-module(lib chan mm). 
%% TCP 中 间 人 
%% 模拟 gen tcp 接 口 


-export([loop/2, send/2, close/l1, controller/2, set trace/2, trace with tag/2]). 


send (Pid, Term) -> Pid ! {send, Term}. 
close(Pid) -> Pid ! close. 

controller(Pid, Pidl) -> Pid ! {setController, Pidl}. 
set trace(Pid, Xx) -> Pid ! {trace, Xx}., 


QD 相关 内 容 可 参阅 : http://erlang.org/pipermail/erlang-questions/attachments/20011009/824600c5/attachment.ksh。 
一 一 译 者 注 
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trace with tag(Pid, Tag) -> 
set trace(Pid, {true, 
fun(Msg) -> 
i0:format ("MM:~p ~p~n", [Tag, Msg]) 
end})., 


loop(Socket, Pid) -> 
%% trace with tag(self(), trace) 
process flag(trap exit, true), 
loopl(Socket, Pid, false)., 


loopl(Socket, Pid, Trace) -> 
receive 
{tcp, Socket, Bin} -> 
Term = binary_ to term(Bin), 
trace it(Trace,{socketReceived, Term}), 
Pid ! {chan, self(), Term}, 
loopl(Socket, Pid, Trace); 
{tcp closed, Socket} -> 
trace it(Trace, socketClosed), 
Pid ! {chan closed, self()}; 
{'EXIT', Pid, Why} -> 
trace it(Trace, {controtllingProcessExit, Why}), 
gen tcp:close(Socket); 
{setController, Pidil} -> 
trace it(Trace, {changedController, Pid}), 
loopi{({Socket, Pidil, Trace); 
{trace, Tracel} -> 
trace it(Trace, {setTrace, Tracel}), 
loopi(Socket, Pid, Tracel); 
CLOSe -> 
trace it(Trace, closedByClient), 
gen tcp:close(Socket),; 
{send, Term} -> 
trace it(Trace, {sendingMessage, Term}), 
gen tcp:send{(Socket, term to binary(Term)), 
loopl{({Socket, Pid, Trace); 
UUg -> 
io:format("iib chan mm: protocol error:~p~n", {UUg]), 
loopl(Socket, Pid, Trace) 
end. 
trace it(false, ) -> Vold; 
trace it({true, F}, M) -> F(M). 
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B.3.4 Lib chan auth 


socket dist/lib_chan_auth.erl 


-module(lib chan auth). 
-export( [make challenge/0, make response/2, is response correct/3]). 


make challenge() -> 
random string(25). 
make response(Challenge, Secret) -> 
lib md5:string(Challenge ++ Secret). 
jis response correct(Challenge, Response, Secret) -> 
case Lib md5:string(Challenge ++ Secret) of 
Response -> true; 
-> false 


end . 


%% ,random string(N) -> 一 个 随机 字符 串 (内 含 N 个 字符 ) 
random string(N) -> random seed(), random string(N, []). 
random string(0, D) -> D; 
random string(N, D) -> 

random string(N-1, [random:uniform(26)-1+$a|D]). 
random seed() -> 

{ , ,XxX} = erlang:now!(), 

{H,M,S} = time(), 

Hl = H * xX rem 32767, 

M1 = M * X rem 32767, 

Sl = 5S * X rem 32767, 

put(random seed, {Hl1,M]1,S1}). 





一 种 简单 的 执行 环境 


在 本 附录 里 ， 我 们 将 构建 一 种 运行 Elang 程 序 的 简单 执行 环境 (Simple Execution Environment， 
人 简称 SEE )。 之 所 以 把 代码 放 入 本 书 的 附录 而 不 是 正文 是 因为 它 的 风格 不 同 。 本 书 里 的 所 有 代码 
都 适合 在 标准 的 Erlang/OTP 分 发 套装 里 运行 ， 而 这 些 代 码 会 有 意 避 人 免 使 用 Erlang 库 代码 ， 尺 量 只 
使 用 Erlang 的 基本 了 滑 数 。 

第 一 次 见 到 Erlang 时 ， 人 们 经 常会 分 不 清 哪 些 属于 语言 ， 哪 些 属于 操作 环境 。OTP 提 供 了 一 
种 类 似 操作 系统 的 丰富 环境 来 长 期 运行 分 布 式 Erlang 应 用 程序 。 然 而 ，Erlang (语言 ) 和 OTP ( 环 
境 ) 到 底 都 提供 了 哪些 功能 却 很 难 分 辩 。 

SEE 提供 了 一 种 “更 接近 本 质 ” 的 环境 , 它 能 够 更 好 地 区 分 哪些 是 Erlang 提 供 的 , 哪些 是 OTP 
提供 的 。SEE 所 提供 的 都 包含 在 单个 模块 内 。OTP 启 动 时 会 载 人 60 个 左右 的 模块 ， 很 难 一 眼看 出 
它 的 工作 方式 ,但 如 果 知 赴 该 往 哪 儿 看 ， 就 不 会 特别 复杂 了 。 局 动 文件 是 第 一 个 该 看 的 。 从 局 动 
文件 入 手 然后 阅读 init.erL 里 的 代码 ， 一 切 就 能 了 然 于 胸 了 。 

SEE 环 境 可 以 用 于 脚本 编程 ， 因 为 它 的 局 动 速度 很 快 , 也 可 以 用 于 般 入 式 开 发 ， 因 为 它 非 党 
小 。 要 做 到 这 些 ， 你 需要 了 解 Erlang 是 如 何 启动 的 ， 以 及 代码 目 动 载 入 系统 是 如 何 工作 的 。 

当 启 动 一 个 标准 Erlang 系 统 时 ( 通过 shell 命 令 erl )， 会 载 人 67 个 模块 并 启动 25 个 进程 ， 然 后 
程序 才能 运行 。 这 需要 大 概 1 秒 钟 的 时 间 。 如 采 想 执行 的 程序 不 需要 标准 系统 提供 的 这 些 好 东西 ， 
时 间 束 可 以 缩短 到 几 十 坚 秒 。 

弄 清 这 67 个 模块 和 进程 的 作用 是 个 艰巨 的 任务 , 但 还 有 一 条 更 短 的 路 可 走 。SEE 简 化 了 系统 ， 
使 你 只 需 研 究 一 个 模块 就 能 理解 代码 载 人 系统 与 提供 IO 服务 的 方式 .SEE 只 用 一 个 模块 就 能 提供 
目 动 载 和 人 、 通 用 服务 从 进程 和 错误 处 理 功能 。 

启动 SEE 之 前 ， 先 来 收集 一 些 OTP 系 统 的 统计 信息 以 供 将 来 参考 。 

$ erl 

1> length([I||{I,X} <- code:all Loaded()，X =/= preLoaded] ) . 

3 length (processes ()). 

25 


3> length(registered!()). 
16 


code:alL Loaded() 会 返回 一 个 列表 ， 内 含 系统 当前 载 人 的 所 有 模块 。processes () 是 一 
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个 内 置 晒 数 ， 它 会 返回 一 个 包含 所 有 系统 已 知 进程 的 列表 ， 而 registered() 会 返回 一 个 包含 所 
有 已 注册 进程 的 列表 。 

由 此 可 见 , 光 局 动 系统 就 会 载 人 67 个 模块 并 局 动 25 个 进程 ,其 中 有 16 个 注册 进程 。 我 们 来 看 
看 能 否 减 少 这 些 数 日 。 


C.1 Erlang 是 如何 启动 的 


当 Erlang 局 动 时 , 它 会 广 取 一 个 局 动 文 件 并 执 和 了 里 面 的 多 命令 .有 8 个 Erlang 模 块 是 预先 载 人 的 ， 
这 些 桩 块 已 被 编 详 为 C 并 链接 到 Erlang 的 虚拟 机 里 。 这 8 个 模块 负责 局 动 系统 ， 其 中 包括 init.er 
( 读 取 和 执 es 和 erl prim Loader (把 代码 载 人 系统 )。 

启动 文件 包含 一 个 通过 term to binary(Script) 创 建 的 二 进 制 型 ， 其 中 Script 是 一 个 包 
含 司 动 脚本 的 元 组 。 

我 们 将 制作 一 个 新 的 启动 文件 ( 名 为 see.boot ) 和 一 段 脚 本 (名 为 see )， 后 者 会 用 这 个 新 
文件 来 局 动 程序 。 局 动 文 件 会 载 人 少量 模块 , 其 中 包括 see .erl, 它 将 包含 我 们 的 定制 执行 环境 。 
局 动 文 件 和 脚本 的 创建 方式 是 执行 nake_scripts/0。 





see/see.erl 


make scripts() -> 
{ok, Cwd} = file:get cwd!(), 
Script = 
{script,{"see","l1.0"}, %%< 
[{preLoaded, preloaded()}, 各 %< 
{progress,preloaded}, 


abel id="boot.tag"/> 
abel id="boot,.preloaded'"/> 


{path, [Cwd]}, %%<label id="boot,path"/> 
{primLoad, %%<label id="boot.preloadl"/> 

[lists, 

error handler, 

See 

] }， %%<LabelL id="boot,preload2"/> 
{kernel load completed}, %%<label id="boot.Kkernel"/> 


{progress,kernel load completed}, 
{progress, started}, 
{apply, {see,main,[]}} %% <label id="boot.apply"/> 
| 和 
1Io:format("9cript:~p~n" [Script]), 
file:write file("see.boot", term to binary(Script)), 
file:write file("see",[ 
"#1!/bin/sh\nerl ", 
%%" -init debug ",， 
" -boot ", Cwd, "/see ", 
"-environment “printenv -load $1\n"]), 
os:cmd("chmod a+X see"), 
init:stop(), 
true. 
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代码 行 首 和 完 用 一 个 字符 串 来 标注 脚本 ， 接 下 来 是 一 个 通过 init .erl 执 行 的 命令 列表 。 第 一 
个 命令 (元 组 {preloaded, [Mods]} ) 告诉 系统 已 经 预 加 载 了 哪些 模块 。 接 下 来 是 {progress， 
Atom} 人 命令，progress 元 组 是 供 调试 用 的 ， 如 果 局 动 Erlang 的 命令 行 包 含 -init debug 标记， 就 
会 把 它 打印 出 来 。 
第 7 行 的 元 组 {fpath，[Dirs]} 设 置 了 代码 载 人 希 路 径 ， 而 {primLoad，[Mods]} 的 意思 是 载 
入 这 个 模块 列表 里 的 模块 。 因 此 , 这 几 行 告诉 系统 要 从 所 给 的 代码 路 径 里 载 人 三 个 模块 (Lists、 
error handler 和 see )。 
载 人 所 有 代码 后 ， 会 遇 到 命令 {kernel Load completed}。 它 的 意思 是 “已 经 准备 就 绪 ”， 
接 下 来 会 把 控制 权 交 给 用 户 代码 。 在 "内核 载 和 人 完成 "这 个 命令 之 后 ( 而 不 是 之 前 ) 才 能 调用 apply 
来 执行 用 户 函 效 。 最 后 ， 第 16 行 里 的 {appLy,{fsee,main, []}} 会 调用 appLy(see,main,[])。 
make _ scripts/0 必 须 在 Erlang 开 发 环境 内 执行 , 因为 它 调 用 了 code、filename 和 file 模 块 
里 的 也 数 ，SEE 程 序 是 无 法 使 用 这 些 模 块 的 。 
现在 来 构建 启动 文件 和 启动 脚本 。 
$ erlc see.erl 
$ erl -s see make scripts 
Eshell V5.9.3 {abort with ^G) 
Script:{script,{"see"”,"i.0"}, 
[{preLoaded, [zlib,prim file,prim zip,prim inet,erlang, 
otp ringO,init,erl prim loader]}, 
{Progress,preloaded}, 
{path, {"/Users/joe/projects active/book/jaerliang2/Book/code/see" 1}, 
{primLoad, {tists,error handler, seel}, 
{kernel load completed}, 
{progress, kernel load completed}, 
{progress, started}, 
{apply, {see, main, []}}]} 




















C.2 在 SEE 里 运行 一 些 测试 程序 


构建 完 启动 脚本 后 ， 就 可 以 把 注意 力 转 向 将 在 SEE 里 运行 的 程序 了 。 我 们 列举 的 所 有 示例 都 
是 普通 Erlang 模 块 ， 它 们 必须 导出 main( ) 涵 数 。 
程序 中 最 简单 的 是 see_ test1。 








see/see_ test1.erl 

-module(see test1). 

-export( [main/0]). 

main() -> 
see:write("HELLO WORLD\N"), 
see:write(integer to list(see:modules loaded()-8) ++ " modules loaded\n"). 


为 了 运行 它 ， 首 先 要 用 Erlang 开 发 环境 里 的 标准 编译 器 编译 see test1。 做 完 这 步 之 后 ， 就 
可 以 运行 程序 了 。 
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$ erlc see testl,.erl 
$ , /See see test1 
Hello world 


可 以 给 它 计 时 ,就 像 下 面 这 样 : 


$ time ./see see test1 
HELLO WORLD 


4 modules loaded 


real OmO .019s 
User QMO .O0165 
SYS omo .000s 


由 此 可 见 ， 载 入 4 个 模块 (Lists、error handler、see 和 see test1 ) 并 运行 程序 总 共 花 
了 0.019 秒 。 


作为 对 比 ， 我 们 可 以 给 OTP 系 统 的 对 应 Erlang 程 序 计 时 。 


see/otp_test1.erl 


-module(otp test1). 
-export( {main/0]). 


main() -> 
io:format ("HELIO WORLD\N"). 


$ erlc otp test1.erl 
$ time erl -noshell -s otp test1l main -s init stop 
HELLO WORLD 


real Omi .127s 
USer OmO ., 100s 
SYS Om0 .0245 





用 SEE 启 动 并 运行 我 们 的 小 程序 比 用 OTP 快 59 倍 。 不 过 请 记 住 ，OTP 的 设计 目标 并 不 包括 快 
速 启动 。 对 OTP 应 用 程序 的 期 望 是 启动 后 能 永久 运行 ， 所 以 削减 几 毫 秒 的 启动 时 间 相 对 于 之 后 的 
永久 运行 来 说 意义 不 大 。 

这 里 还 有 一 些 简 单 的 程序 。see test2 负 责 测 试 自动 载 人 能 否 工 作 。 








see/see test2.erl 


-module(see test2). 
-export( [main/0]). 


main() -> 
erlang:display({about to call,my code}), 
2000 = my code:double(1000), 
see:write('"see test2 worked\in"). 


其 中 : 
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see/my_code.erl 


-module(my code). 
-export([double/1]). 


double(X) -> 
2*X, 


从 而 : 


$ ./see see test2 

{about to call,my code} 

{new error handler,undefined function,my code,double, [1000]} 
{error handler,calling,my code,double, [1000]} 

see test2 worked 


可 以 看 到 my_code 模 块 自动 载 人 成 功 , 其 余 输 出 内 容 是 一 个 自 定义 代码 载 和 器 打印 出 来 的 调 
试 信息 。 它 是 由 error_handler 模 块 生成 的 ， 我们 将 在 本 章 后 面 进行 讨论 。 

see_test3 是 一 个 Erlang 程 序 ， 它 会 把 标准 输入 里 能 看 到 的 所 有 内 容 都 复制 到 标准 输出 里 。 
(这 正 是 Unix 管 道 进程 的 编写 方式 。) 











see/see test3.erl 


-module(see test3)., 
-export([main/0]). 
-limport(see, [read/0, write/1]). 


main() -> loop()., 


loop() -> 
case read() of 

eof -> 
true,; 

{ok, X} -> 
write([X]), 
loop() 

end. 
这 里 有 一 个 例子 : 


$ cat see.erl | cksum 

3915305815 9065 

$ cat see.erl | ./see see test3 see.erl | cksum 
3915305815 9065 


see_test4 人 负责 测试 错误 处 理 。 


see/see test4.erl 


-module(see test4)., 
-export( [main/0]). 
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main() -> 
see:write("I WILL crash now\in"), 
下 这 
see:write("This LIne will not be printed\n"). 


文 里 有 一 个 例子 : 


$ see See test4 
I will crash now 
{stopping system,{{badmatch,2}, 
[{see test4,main,d0,[{file,"see test4.erl"},1{line,6}]}]}} 


C.3 SEE 的 API 


see.erl 这 个 单独 模块 导出 了 下 列 也 数 。 
DQ main() 

局 动 系统 。 
口 joad_ module{Mod) 

载 人 模块 Mod。 
口 |og_errorErron) 

在 标准 输出 里 打印 Error 的 值 。 
口 make server(Name, FunStart, | 

创建 一 个 名 为 Name 的 永久 性 服务 需 。 这 个 服务 需 的 初始 状态 由 FunStart () 决 定 ， 服 务 需 

的 “处 理 逢 ”函数 是 fanFunHandLer We 上 
D rpc(Name, Query) 

生成 一 个 对 服务 器 Name 的 远程 过 程 调 用 Query。 
口 change behaviour(Name,FunHandler) 

问 服务 器 Name 发 送 一 个 新 处 理 右 函数 FunHandler 来 改变 它 的 行为 。 
口 keep alive(Name, Fun) 

确保 始终 存在 一 个 名 为 Name 的 注册 进程 。 这 个 进程 由 Fun() 局 动 (或 重 局 )。 
DD make global(Name, Fu 

生成 一 个 名 为 Name 的 全 局 注册 进程 ， 它 自身 会 分 裂 出 fun Fun()。 
DD on exit(Pid, Fun) 

监视 Pid 进 程 。 如 果 该 进程 退出 并 生成 原因 {'EXIT' ，Why}， 束 执行 Fun (Why ) 。 
DD on halt({Fun) 

设置 一 个 条 件 ， 使 Fun( ) 在 收 到 集 止 系统 的 请 求 时 执行 。 如 末 指 定 了 多 个 fun 就 全 部 调用 。 
口 Stop system(Reason) 

停止 系统 并 生成 原因 Reason。 
DD every(Pld, Time, Fun) 

只 要 Pid 没 有 终止 ， 束 每 隔 Time 坚 秒 执 行 一 次 Fun( ) 。 
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口 lookup(Key,[{keyVal}]) -> {found, Val} | not found 
在 某 个 字典 里 查找 Key 键 。 
Dreadu -> [string( | eof 
从 标准 输入 里 谈 取 下 一 行 。 
口 write([string(})]) -> ok 
把 string 写 入 标准 输出 。 
D env(Name) 
返回 环境 变量 Name 的 值 。 
这 些 国 数 可 以 用 于 简单 的 Erlang 程 序 。 





C.4 SEE 的 实现 细节 
启动 一 切 的 shell 脚 本 (see ) 如 下 : 


#!/bin/sh 
erl -boot /home/joe/erl/example programs-2.0/examples-2.,0/see\ 
-~environment ‘printenv -load $1 


C.4.1 SEE 主 程序 
系统 启动 时 会 执行 sSee:main()， 当 它 终 止 时 ， 系 统 也 会 停止 。see:main() 的 代码 如 下 : 


see/see.erl 
main() -> 
make server(1o0, 
fun start io/0, fun handle 1072) ， 
make server(code, 
const( [lists,error hander,see|preloaded()]), 
fun handle code/2), 
make server(error Logger， 
const(0), fun handle error logger/2), 
make server(halt demon, 
const([]), fun handle halt demon/2), 
make server(enyv, 
fun start env/9, fun handle env/2), 
Mod = get module name(), 
Load module (Mod), 
run(Mod). 


它 会 司 动 5 个 服务 六 ( io、code…… )， 载 入 错误 处 理 硕 ， 找 出 待 运行 模块 的 名 称 并 载 人 该 
模块 ， 然 后 运行 模块 里 的 代码 。run(Mod) 会 分 裂 并 连接 Mod:main( ) ， 然 后 等 竺 它 终 止 。 当 它 终 
止 时 会 调用 stop system。 
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see/see.erl 
run(Mod) -> 
Pid = Spawn link{(Mod, main, []), 
on exit(Pid, fun(Why) -> stop system(Why) end). 
main/0 会 局 动 许多 不 同 的 服务 硕 。 在 介绍 这 些 服务 融 的 工作 细节 之 前 ， 先 来 看 看 用 于 构建 
客户 端 - 服 务 僵 的 通用 框 染 。 








C.4.2 SEE 里 的 客 忆 站 - 服 务 器 模型 


要 创建 一 个 服务 器 ， 我 们 会 调用 make server(Name，Fun1，Fun2) 。Name 是 服务 器 的 全 局 
名 称 ，Fun1() 的 预期 返回 值 是 Statel1， 也 就 是 服务 各 的 初始 状态 。 如 果 是 远程 过 程 调用 
Fun2(State，Query)， 这 个 函数 就 应 当 返 回 {fReply，Statel}; 如 果 是 cast 调 用 ， 就 只 返回 
Statel。make server 的 代码 如 下 : 


see/see.erl 


make server(Name, FunD, FunH) -> 
make global (Name, 
fun() -> 
Data = FunD(), 
server loop(Name, Data, FunH) 


end). 
这 个 服务 右 的 循环 就 像 下 面 这 样 : 


see/see.erl 


server loop(Name, Data, Fun) -> 
receive 
{rpc, Pid, Q} -> 
case (catch Fun(Q, Data)) of 
{'EXIT', Why} -> 
Pid ! {Name, exit, Why}, 
server loop(Name, Data, Fun); 
{Reply, Datal} -> 
Pid ! {Name, Reply}, 
server loop(Name, Datal, Fun) 
end; 
{cast, Pid, Q} -> 
case (catch Fun(Q, Data)) of 
{'EXIT', Why} -> 
exit (Pid, Why), 
server loop(Name, Data, Fun); 
Datal -> 
server loop(Name, Datal, Fun) 
end; 
{eval, Funl} -> 
server loop(Name, Data, Fun1) 
end. 
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要 对 服务 需 进 行 查 询 ， 会 使 用 rpc (Remote Procedure Call 的 缩写 ， 即 远程 过 程 调 用 )， 它 的 


代码 如 下 : 


see/see.erl 
rpc(Name, Q) -> 
Name ! {rpc, self(), Q}, 
receive 
{Name, Reply} -> 
Reply; 
{Name, exit, Why} -> 
exit (Why) 
end. 


请 注意 服务 器 循环 里 的 代码 是 如 何 与 rpc 交 互 的 。 服 务 器 里 的 处 理 函数 fun 受 catch 保 护 ， 如 





末 服 务 帮 抛 出 一 个 腊 第 错误 , 就 会 把 {Name,exit,Why} 消 县 发 回 客户 问 。 如 末 客 户 问 收 到 了 这 个 
消息 ， 就 会 执行 exit (Why) 来 抛 出 一 个 寞 第 错误 。 











这 种 机 制 的 最 终 效 果 就 是 让 客户 剖 抛 出 一 个 异 津 错误。 请 注意 , 如 果 服 务 表 无 法 处 理 客 户 端 


发 送 的 查询 ， 就 会 以 原 有 状态 继续 运行 。 


所 以 ,对 服务 融 而 言 ， 远 程 过 程 调用 就 像 事务 一 样 。 如 采 它 们 不 能 完整 执行 ,服务 表 就 会 回 


深 到 远程 过 程 调 用 发 起 之 前 的 状态 。 





如 果 只 想 给 服务 上 帮 发 一 个 消息 而 不 关心 它 是 否 回 复 ， 束 调用 cast/2。 


see/see.erl 


cast(Name, 0Q) -> 
Name ! {cast, self{), Q}. 


可 以 给 服务 器 发 送 另 一 个 用 于 循环 的 hn， 从 而 改变 服务 器 的 行为 。 





see/see.erl 
change behaviour(Name, Fun) -> 
Name ! {eval, Fun}. 


别 忘 了， 忆 动 服务 侣 时 的 初始 数据 结构 经 党 是 一 个 当量。 可 以 定义 const (C)， 让 它 返 回 一 





个 函数 ， 此 函数 执行 后 会 返回 C。 


C.4.3 ”代码 服务 器 


see/see.erl 


const{(C) -> fun() -> C end. 
现在 再 把 注意 力 放 到 各 种 服务 大 上。 


代码 服务 而 的 局 动 方式 是 执行 下 面 这 个 前 数 : 
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see/see.erl 


make server(Name, FunD, FunH) -> 
make global (Name, 
fun() -> 
Data = FunD(), 


server loop(Name, Data, FunH) 
end). 


Load module (Mod) 会 对 代码 服务 退 进 行 远 程 过 程 调 用 。 


Load module(Mod) -> 
rpc(code, {load, Mod}). 


代码 服务 硕 的 全 局 状态 是 [Mod] ， 也 就 是 一 个 包含 所 有 已 加 载 模块 的 列表 。( 它 的 初始 值 是 
[init，erL prim Loader]。 这 些 模块 是 预 加 载 的 ， 被 编译 到 Erlang 运 行 时 系统 的 内 核 里 。) 
服务 器 的 处 理 函 数 handle code/see/2 如 下 : 


handle code(modules loaded, Mods) -> 
{length(Mods), Mods}; 
handle code({load, Mod}, Mods) -> 
case member(Mod, Mods) of 
true -> 
{already loaded, Mods}; 
false -> 
case primLoad(Mod) of 
{ok,Mod} -> 
{{ok,Mod}, [Mod|Mods]}; 
Error -> 
{Error, Mods} 
end 
end. 


primLoad 人 负责 载 人 工作 : 


primLoad(Module) -> 
Str = atom to list(Module), 
case erl prim loader:get file(Str ++ ",beam") of 
{ok, Bin, FullName} -> 
case erlang:load module(Module, Bin) of 
{module, Module} -> 
{ok,Module}; 
{module, } -> 
{error, wrong_ module in binary}; 
_Other -> 
{error, {bad object code, Module}} 
end; 
_Error -> 


{error, {cannot locate, Module}} 
end. 
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C.4.4 销 误 记 录 顺 
Log_error(wWhat) 会 记录 标准 输出 上 的 错误 What， 它 是 以 播发 的 形式 实现 的 。 


see/see.erl 


log error(Error) -> Cast(error logger, {log, Error}). 
对 应 的 服务 需 处 理 困 数 如 下 : 


see/see.erl 


handle error logger({log, Error}, N) -> 
erlang:display({error, Error}), 
{ok, N+l1}. 


请 注意 ， 错 误 记 录 器 的 全 局 状态 是 一 个 整数 N， 代 表 已 发 生 错 误 的 总 数 。 
C.4.5 ”停止 守护 程序 


停止 守护 程序 (halt demon ) 是 在 系统 停止 时 调用 的 。 执 行 on_halt (Fun) 会 设置 一 个 条 件 ， 
使 Fun( ) 在 系统 停止 时 执行 。 集 止 系 统 的 方法 是 调用 stop_system() 函数 。 





see/see.erl 


on_halt(Fun) -> cast(halt demon, {on_halt,Fun}). 
stop_system(Why) -> cast(halt demon,{stop_ system,Why}). 


它 的 服务 融 处 理 代 码 如 下 : 


see/see.erl 


handle halt demon({on halt, Fun}, Funs) -> 
{ok, [Fun|Funs]}; 
handle halt demon({stop system, Why}, Funs) -> 
case Why of 
normal -> true; 
-> erlang:display({stopping system,Wwhy}) 
end, 
map(fun(F) -> F() end, Funs), 
erLang :haLt() ， 


{ok, []}. 


C.4.6 ”1/O 服 务 器 


LO 服务 从 允许 对 STDIO 进 行 访问 。read() 会 从 标准 输入 里 读 取 一 行 ，write(String) 则 会 
把 一 个 字符 串 写 人 标准 输出 。 
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see/see.erl 


read ( ) -> rpc(i0o, read). 
write(X) -> rpc(i0o, {write, X}). 


IO 服务 需 的 初始 状态 通过 执行 start_ io() 获 得 。 


see/see.erl 

start i0() -> 
Port = open port({fd,0,]1]}, [eof, binary]), 
process flag(trap exit, true), 
{false, Port}. 


IO 处 理 融 的 代码 如 下 : 


see/see.erl 


handle io(read, {true, Port}) -> 
{eof, {true, Port}},; 
handle io(read, {false, Port}) -> 
receive 
{Port, {data, Bytes}} -> 
{{ok, Bytes}, {false, Port}},; 
{Port, eof} -> 
{eof, {true,Port}},; 
{'EXIT', Port, badsig} -> 
handle io(read, {false, Port}); 
{'EXIT', Port, Why} -> 
{eof, {true, Port}} 
end ; 
handle io({write,X}, {Flag,Port}) -> 
Port ! {self(})}, {command, X}}, 
{ok, {Flag, Port}}. 


I/O 服 务 兢 的 状态 是 {Flag，Port}。 如 果 遇 到 eof，Flag 就 是 true， 耕 则 就 是 false。 


C.4.7 环境 服务 器 和 证 
env(E) 盟 数 的 作用 是 找 出 环境 变量 E 的 值 。 


see/see.erl 
env (Key) -> rpc(env, {lookup, Key}). 
这 个 服务 各 的 代码 如 下 : 


handle env({lookup, Key}, Dict) -> 
{Lookup(Key, Dict), Dict}. 


服务 带 的 初始 值 通过 执行 以 下 代码 获得 


start env() -> 
Env = case init:get argument(environment) of 
{ok, [L]1} -> 
| 
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error -> 
fatal({missing, '-environment ...'}) 
end, 
map(fun split env/1, Env). 
sphlit env(Str) -> split env(Str, [1]). 


C.4.8 全 局 进程 文 持 函数 


我 们 需要 一 些 方法 来 保持 进程 运行 和 注册 进程 的 全 局 名 称 。 
keep_ alive(name，Fun) 会 生成 一 个 名 为 Name 的 注册 进程 。 它 是 由 Fun() 启 动 的 ， 如 果 进 
程 挂 了 ， 就 会 被 目 动 重 局 。 





see/see.erl 


keep alive(Name, Fun) -> 
Pid = make global (Name, Fun), 
on exit (Pid, 
fun( Exit) -> keep alive(Name, Fun) end). 


make gtLobaL(Name，Fun) 会 检查 是 否 存在 一 个 注册 名 为 Name 的 全 局 进程 。 如 果 不 存在 ， 
它 就 会 分 袭 出 一 个 进程 来 执行 Fun ( ) ， 并 注册 进程 名 Name。 











see/see.erl 


make global (Name, Fun) -> 
case whereis (Name) of 
undefined -> 
Self = self(), 
Pid = spawn(fun() -> 
make global (Self,Name,Fun) 


end), 
receive 
{Pid, ack} -> 
Pid 
end; 
Pid -> 
Pid 


end. 
make global (Pid, Name, Fun) -> 
case register(Name, self()) of 
{'EXIT', } -> 
Pid ! {self(), ack}; 
-> 
Pid ! {self(), ack}, 
Fun() 
end. 
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C.4.9 进程 文 持 函 数 
on_exit(Pid，Fun) 与 Pid 相 连 。 如 有 果 Pid 骨 省 并 生成 原因 Why ， 就 会 执行 Fun (Why ) 。 


see/see.erl 
on exit(Pid, Fun) -> 
spawn (fun() -> 
process flag(trap exit, true), 


link (Pid), 
recelive 
{'EXIT', Pid, Why} -> 
Fun (Why) 
end 


end), 
every(Pid，Time，Fun) 与 Pid 相 连 ，Fun() 会 每 隔 Time 时 间 执 行 一 次 。 如 果 Pid 退 出 ， 这 


个 过 程 就 会 停止。 


see/see.erl 
every(Pid, Time, Fun) -> 
spawn (fun() -> 
process flag(trap exit, true), 
link (Pid), 
every loop(Pid, Time, Fun) 
end). 


every_ loop(Pid, Time, Fun) -> 


receive 
{'EXIT', Pid, Why} -> 
true 
after Time -> 
Fun(), 
every loop{(Pid, Time, Fun) 
end . 


C.4.10 ”工具 函数 
get_module_name() 会 从 命令 行 获取 模块 名 。 


see/see.erl 
get module name() -> 
case init:get argument(load) of 
{ok, [[Arg]]} -> 
module name(Arg); 
error -> 
fatal({missing, '-load Mod'}) 
end ， 
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C.5 Erlang 如 何 载 入 代码 


Erlang 的 默认 代码 载 和 机制 是 “ 按 需 ” 载 人 和 人 代码。 代码 被 首次 调用 时 ， 如 果 系 统 发 现代 人 码 缺 
失 ， 了 驶 会 载 人 它 。 

来 看 看 具体 的 过 程 。 假 设 程序 调用 了 my mod:myfunc(Argl，Arg2，..，ArgN) 子 数 ， 但 这 
个 模块 的 代码 尚未 被 载 人 ， 系 统 就 会 日 动 把 这 个 调用 转换 成 下 面 的 形式 : 


error module:undefined functiontmymod myfunc [Argl Arg2 ..,, ArgN]) 








undefined function 类 似 下 面 这 样 : 


undefined function(Mod, Func, ArgList) -> 
case code'load module(Mod) of 
{ok, Bin} -> 
erlang:load module(Mod, Bin), 
apply(Mod, Func, ArgList), 
{error, } -> 


end 
这 个 未 定义 冰 数 处 理 融 把 寻找 模块 代码 的 任务 指 铂 给 代 但 处 理 硕 。 如 有 末代 但 处 理 需 能 找到 目 
标 代 码 ， 就 会 载 入 模块 然后 调用 appLy(Mod，Func，ArgList) ， 系 统 则 会 继续 运行 ， 就 像 调用 
转换 没有 发 生 过 一 样 。 
负责 此 事 的 SEE 代码 遭 循 这 个 模式 : 


see/error handler.erl 


-module(error handler). 
-export([undefined function/3,undefined global name/2]). 
undefined function(see, F, A) -> 
erlang:display({error handler,undefined function， 
see,F,A}), 
exit(o0ps); 
undefined function(M, F, A) -> 
erlang:display({new error handler,undefined function,M,F,A}), 
case see:load module(M) of 
{ok, M} -> 
case erlang:function exported(M,F,Length(A)) of 
true -> 
erlang:display({error handler,calling,M,F,A}), 
apply (M, F, A); 
false -> 
see:stop system({undef,1M,F,A}}) 
end; 
{ok, Other} -> 
see:stop system({undef,{M,F,A}}); 
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already loaded -> 
see:stop system({undef,{M,F,A}}); 
{error, What} -> 
see:stop system({load,error,What}) 
end. 
undefined global name(Name, Message) -> 
exit({badarg, {Name,Message}})., 


注意 ”Erlang 系统 的 错误 处 理 器 和 这 里 的 代码 存在 显著 区 别 , 它 所 做 的 远 远 多 于 这 个 简单 的 代码 
处 理 器 。 它 必须 跟踪 模块 版 本 和 其 他 一 些 让 人 费心 的 对 象 。 


错误 处 理 器 被 启动 脚本 载 入 后， 自动 载 人 功能 就 能 正常 工作 了 。 它 使 用 SEE 里 的 代码 处 理 机 
制 ， 而 不 是 OTP 系 统 的 机 制 。 


C.6 练习 


(1) SEE 提供 了 目 动 载 人 功能 ， 但 我 们 可 以 编写 一 个 更 简单 的 〈 不 审 目 动 载 人 )。 移 除 与 目 动 
载 人 有 关 的 代码 。 

(2) 你 甚至 不 需要 SEE 就 能 编写 完全 独立 的 应 用 程序 。 编写 一 个 最 简单 的 程序 , 让 它 把 “Hello 
world” 写 入 标准 输出 然后 终止 。 

(3) 编写 一 个 最 简单 的 cat 程 序 ， 让 它 把 标准 输入 里 的 内 容 复制 到 标准 输出 〈 就 像 see test3. 
erl 一 样 )， 但 不 通过 SEE 局 动 。 复 制 一些 大 文件 并 计时 ， 然 后 与 一 些 流行 的 脚本 语言 进行 比较 。 




















